Як хлопці з Storyline повернулися з Кремнієвої долини в Мінськ з $770 тисячами на стартап

У 2017 році Василь Шинкоренко і Максим Абрамчук створили сервіс Storyline, де можна розробляти програми для голосового помічника від Amazon не використовуючи програмування. Хлопці брали участь у двох акселераторах в Кремнієвій долині — Boost VC і Y Combinator. Навесні 2018 вони отримали $770 тисяч інвестицій.

Хлопці з fillpackart подзвонили їм і про все розпитали — що під капотом сервісу, як бути розробником в стартапі, як їм жилося в долині і як скоро голосові асистенти змінять світ.

— Ви зараз Білорусі?

Василь: — Так, 8 місяців були в Каліфорнії, і в квітні прилетіли назад, як тільки пройшли YC. Ще там ми обмірковували варіанти, як краще будувати компанію. Було багато опцій, але вирішили повернутися до Мінська.

В першу чергу, звичайно, з-за ресурсів. У Мінську набагато простіше і дешевше шукати людей, ніж в долині. Там ти конкуруєш з великими компаніями, з крутими стартапами, які випускаються щороку. А тут ми єдині, хто пройшов YC в історії Білорусі. Тут нам не потрібно піднімати настільки багато грошей, щоб платити інженерам по 200 тисяч на рік. Ми зараз на стадії, де працюємо 12 годин на добу. Немає різниці, де безвилазно працювати. Тому ми вибрали Мінськ.


Максим Абрамчук Василь Шинкоренко

— Офіс вже зняли, облаштувалися?

В: — так, Так! У нас чудовий офіс на четвертому поверсі, з видом на річку, в центрі міста.

— Велику команду плануєте набирати?

В: — Зараз нас 6 чоловік. До кінця року буде 10. А далі все дуже сильно залежить від метрик. Щоб досягти тих цілей, які ми собі поставили на рік, нам потрібно буде приблизно 10-15 чоловік.

— Я не те щоб дуже в темі, але пару років жив у Мінську і краєм вуха чув, нібито всіх хлопців там забрали в Wargaming, EPAM та за кордон. Не зіткнулися з такою проблемою?

В: — Так, але фішка в тому, що продуктових компаній все одно дуже мало — особливо стартапів. А стартапів, які більш-менш адекватні, щось роблять і не схожі на напівдохлих зомбі на пальцях однієї руки перерахувати. Я не вважаю, що п’ять компаній, це велика конкуренція.

— Ви вже відчуваєте, що перетворюйтеся в бізнес?

В: — Можна сказати, що ми вже намацали щось, але не можу казати, що саме це приведе нас до глобального успіху.

До того, як продукт з’явився, додатки під Алексу робили тільки розробники, писали код, наймали компанії. Ми, по суті, створили новий сегмент ринку — тепер люди без технічного бекграунду теж їх роблять. І тепер цей сегмент зростає, і зараз ми ростемо, і ринок смарт-спікерів в цілому зростає, кількість додатків від юзерів зростає. Ми вже трошки заробляємо, поки ще не профіт — до нього далеко, але вже десь на горизонті.

Я думаю, поки всі люди залазять в одну кімнату, це більше продукт, ніж бізнес. Ось коли перевалишь за 15-20 чоловік, тоді потрібно буде думати про процеси і в чому іншому.

— Коли ви отримали інвестиції, чого було більше — ейфорії або страху, що не впораєтеся?

В: — Напевно, було відчуття майлстоун. Більшість стартапів не проживають і перші півроку. А коли ти прожив, зробив штуку, яка комусь цікава, люди її використовують, і, найголовніше, реально люблять і готові платити — тоді тобі трохи зрозуміліше, що робити далі.

Ну тобто, не було такого відчуття, що на голові танцювати і кидатися тапками. Просто розуміння, що зараз починається наступний крок, і в ньому свої цілі, свої KPI. У YC дуже допомагали з цим, говорили, як продукт повинен виглядати через рік, і що для цього потрібно робити. І ось ми робимо.

— Розкажіть, чим займалися в Білорусі до від’їзду долину?

В: — Я досить давно сам писав код, але не дуже добре. Потім зрозумів, що мені краще даються комунікації, всякі бізнесові штуки, маркетинг. Почав займатися цим і випадково потрапив у сферу діалогових інтерфейсів — боти в Телеграме, в інших месенджерах, движки, фреймворки для ботів. Крутилися навколо цього. У 2015-му році ми з хлопцями робили кілька продуктів і навіть піднімали якісь гроші.

Разом з Максом ми почали робити один продукт. Хоч він не вдався, але досвід ми отримали. Потім разом побудували агентство з 7 осіб. А до літа 17-го року пішли назад в продукти.

— Макс, а ти?

Максим: — почав Програмувати на першому курсі. У мене була якась така установка в голові, поки я готуюся до універу — вчу фізику, математику і всякі штуки, а за програмування принципово не беруся. Як тільки побачив себе у списках БГУИР — одразу взявся, почав C++, всякі інші штуки. Перші кілька місяців тупив, було дуже важко. Потім дізнався, що є веб, почав втикати у фронтенд. Побачив Ruby, пару місяців писав на ньому. Загалом, метався-крутився і зупинився на бэкенді.

Поставив собі за мету знайти роботу. За кілька місяців підняв Ruby, SQL, зробив пару тестових. В одну компанію мене взяли, і я там пропрацював півроку. Нас було чоловік п’ять, і ми просто робили на аутсорсе різні продукти. Потім пішов в іншу компанію, там попрацював десь півтора року. І тоді якраз запустилася платформа ботів в телеграмі. Не пам’ятаю чому, але я так надихнувся від цього всього. Зверстав за пару днів якийсь сайтик (він може досі ще працює). Ми стали робити ботів на замовлення.

Та от на хвилі цього всього ми з Васею познайомилися і почали робити продукти.

Філл: — тобто, ти  більше бэкендер?

М: — Оскільки я бекенд пишу на Ruby, там є де розгулятися. 30-40% часу доводилося фронт писати, тому, можна сказати, я фулстек. Вісім або дев’ять місяців, поки ми не взяли першого розробника, весь Storyline писав я сам — і фронт і бек і devops і все інше.

Ф: У тебе немає бажання перестати писати код і стати чистим тімлідом?

М: — Я люблю писати код і управляти розробниками теж подобається, але в фуллтайм я б цим не займався. У мене є бажання займатися саме продуктом. Тестувати різні гіпотези, дивитися аналітику, писати роудмапи, спілкуватися з користувачами і так далі. Це супер цікаво. Можливо в майбутньому, коли ми наберемо більше хлопців, і у них досвіду буде сильніше, я зможу їм все передати. Але поки не знаю, коли це здійсниться.

Як ми потрапили в долину і провалили першу ідею

До Мінська приїхав наш друг, який колись брав участь у Boost VC. Ми зустрілися, показали йому проект, який робили для одного кафе. Він сказав: «Прикольна штука! Не думали це перетворити на окремий продукт для кав’ярень?»

Ми такі, «давай спробуємо». Виявилося, він добре знає Адама Дрейпера з Boost VC, і каже: «подайте заявку туди і якщо зможете пройти, поїдьте в долину. Це буде цікавіше ніж те, що ви зараз робите з агентством». Ми такі окей, заповнили заявку зробили певний лэндинг. Спочатку пройшли відбір, потім інтерв’ю по скайпу з Адамом. Нам зробили оффер (BoostVC зазвичай дає 25-50 тисяч за 7% компанії). Ми його взяли і поїхали в долину з продуктом для ресторанів.


Адам Дрейпер

Біля Макдональдса і всяких фастфудів стоять термінали самообслуговування. Вони досить дорогі. У більшості середніх кафешок немає можливості поставити такі, але і не хочеться наймати багато касирів. Ми придумали, як такі термінали замінити легким способом — замовляти їжу через ботів.
Люди через месенджер зможуть робити замовлення, або — якщо це кафешка, поряд з роботою дізнатися, чи немає зараз черги, щоб не витрачати час і не спускатися даремно. Тобто робиш замовлення, приходиш в зручний час, ну і знижку отримуєш за це. А для власників і менеджерів основний поінт — це автоматизація.

Читайте також  Про систему блюра - Laplace Blur

Ось ми приїхали, спробували з цими людьми домовитися. Але виявилося, маленьким кафешках автоматизація не потрібна, їм потрібні клієнти. А великим компаніям пофіг, що термінал самообслуговування спростить життя клієнту. Якщо ти ніхто, і звати тебе ніяк — майже без шансів, що велика компанія зверне на тебе увагу.

Я знайшов одного чувака, який робить планшети для замовлень в ресторанах. Він пройшов через YC, а потім три роки працював над угодою з wendy’s. Ми зрозуміли, що у нас взагалі нічого не спрацює, ми нічого в ресторанах не розуміємо і три роки в такому режимі не проживемо.

Почали думати, в чому шарим. Коли ми робили ботів на замовлення, я завжди малював такі майндмапм — діаграми, як буде йти діалог, які рядки буде говорити юзер, які бот. Величезний чат зі стрілочками, який ми показували клієнтам для затвердження. І ось подумали, як було б класно однією кнопкою переносити цю діаграму реального бота. І щоб для цього не треба було кодити, смикати розробників, якщо клієнт надішле правки.

Так і вирішили переключитися на Storyline.
Ф: Макс, ідея Storyline здавалася тобі цікавою з точки зору реалізації?

М: — Я, насправді, не фанатик особливо попрограммувати заради програмування. Мені подобалася сама ідея. Так, було прикольно писати інтерактивний editor додатків, цікаво було пиляти нові фічі, підтримувати старі, фіксити баги, ростити метрики. А зараз до нас прийшов фронтендер, і оптимізувати разом полотно дуже цікаво — щоб швидше рендерився, відкривався у юзерів, не глючив.

Ф: А до цього ти не працював з канвасом і двомірної графікою?

М: — Так, не працював. Але це я так називаю — канвас. Насправді ми використовуємо d3.js і SVG, тому що писати на канвасі було б ще складніше. На Canvas нам було б потрібно говорити «Візьми ось цю точку ось з такими координатами, намалюй лінію до якихось координат, з такою-то товщиною». А щоб намалювати блок із заливкою з тінями і щоб можна було drag-and-drop-ать пішло б дуже багато часу. Тому вибрали SVG, і особливих проблем з перформансу немає.

Ф: — Багато сил ти витрачаєш на створення прототипів?

М: — Не знаю, добре це чи погано, але я роблю їх досить швидко. Чому ми так швидко і рухалися у нас від ідеї до мінімальної реалізації йшов буквально день або півтора.

Звичайно, зараз я наступаю на граблі з-за цього, тому доводиться переходити до більш стандартного процесу. Все-таки у нас вже не сотні юзерів, а десятки тисяч. Вони знаходить якісь специфічні баги, юзкейсы, які ми не передбачали. Тому доводиться сповільнюватися, додавати тестування — мануальні, автоматизовані.

Але це дуже кайфово, коли ти можеш за пару годин придумати, відразу зробити і тут же отримати фідбек. По-моєму цього не вистачає у свідомості багатьом розробникам. Занадто багато пиляють щоб пиляти, тижнями та місяцями. А по мені це дуже кайфово — придумати, швидко зробити і показати.

— Коли прототип вийшов, ти його допиливаешь або починаєш з нуля переписувати?

М: — Коли ми запустилися, у нас була напружена ситуація — одразу почали приходити юзери, треба було показати, що є трафік. Тоді ми не стали переписувати все, а вирішили використовувати прототип далі і продовжили пиляти фічі поверх нього.

Спочатку був такий концепт: ти пишеш текст, який говорить Alexa, ставиш два слеша і пишеш текст, який говорить юзер. Потім потрібно було готувати всякі переходи робити, змінні і по суті виходив голий текст, який важко дебажити. А юзери у нас не технічні. Вони відкривали дужку, забували її закрити, і все ламалося. Але тоді ми йшли в YC, нас дуже пушили — «Давайте! Давайте!». Юзери росли, баги росли. Здається, ми так зависли з цим прототипом місяці на три.

Як ми запустили прототип і на ходу підміняли його продуктом

Ми зробили першу супер примітивну версію продукту і почали всіх її показувати. До цього часу ми вже зібрали коммьюніті, зробили телеграм канал. Запитали «подивіться таку штуку, що думаєте?» Нам написало дуже багато чуваків. З усіма ми подзвонили, запитали і зрозуміли, що вони хочуть, набагато складніше того, що робимо ми.

Нам допоміг чувак з Slack — Амір Шеват, зараз він VP за Developer Experience в Twitch. Ще він шарить в ботах, навіть написав одну з найбільш популярних книг по темі «Designing Bots». Ми приїхали до нього в офіс Slack, показали наш «прототип» — на той момент це була картинка в Sketch.


Амір Шеват

Він каже «ну прикольно, а як ви хочете це далі розвивати?» Ми говоримо,в месенджері — Telegram, Facebook. Але ще подумали, що це круто лягає на голосові штуки, типу Alexa, Cortana, Google Assistant тому що там немає ніяких контролів, менюшек.  Амір каже, «прикольно, спробуйте зробити першу версію. Буде цікаво». І в той же день ми побачили, що Amazon тільки що відкрив api для Alexa, яке дозволяло створювати програмно скіли (минаючи амазоновскую консоль розробника).

Ми почали робити продукт, але швидко вперлися в проблему. Супер складно було зробити в додатку канвас — штуку, де можна тягати блоки, щось писати.

Наближався демо день в Boost VC. До нього залишався місяць, а роботи на канвас потрібно було приблизно стільки ж. Сиділи вночі в кімнаті, де жили і думали — «Блін, щось ми взагалі не встигаємо. Походу запуститися не встигнемо».

І тут ми знайшли сервіс для майндмэпов Coggle, заімплементили його за пару годин айфреймом, швидко прикрутили пару кнопок і залили. Виходить, коли ти реєструвався в Storyline, ти бачив Coggle (але ми його логотипчик і контроли просто смужкою кольору фону заклеїли). Юзери робили діаграми в ньому, а ми брали їх JSON і переробляли у скілл для Alexa.

І ось зібрали цю штуку, зняли маленький відосик на телефон, як це працює і запустили в кілька груп на Facebook, пов’язаних з Alexa. На наступний день у нас вже було більше сотні лайків, коментарів. Всі просили дати доступ. Звідти і прийшла пара сотень перших юзерів.

Оскільки Coggle був по суті текстом, і там не можна було створювати об’єкти, картинки, всякі штуки — стояла велика тяга мігрувати всі юзерські об’єкти з майндмапи в структури. У нас тоді навіть бази даних не було. Ми у себе зберігали тільки юзерів, майндмапи зберігалися в Coggle, і він нам їх по апішці віддавав.

Треба було засетапить всі зберігання у нас, перенести всі проекти до нас в базу. А це було коли юзери вже почали паблишить свої проекти. Так що всі ці історії про стартапи, коли вистрілює прототип і його на ходу доводиться підміняти продуктом — це прямо про нас.
Ф: — Якщо ми з друзями будемо робити проект, ми виберемо технології, які знаємо, а не ті, що могли краще б підійти. У вас теж так було?

Читайте також  Створення Штучного Інтелект методом «глокой куздры». Інтелектуальна одіссея

М: — Так, в принципі так. Але нам дуже здорово пощастило, тому що JS і Ruby це такий відмінний стек для стартапу. В Ruby можна дуже швидко все запив, і я б не сказав, що все стає погано потім. Якщо, звичайно, не досягаєш рівня Twitter — тому Twitter і переписали з Ruby на Scala.

Поки ти стартап, тобі цілком вистачить Ruby on Rails. Але якщо б я писав на Java, напевно, не було б все так райдужно.

Ф: Тут в тому і проблема, що ти можеш зробити добре тільки на чому вмієш. А JS у вас чистий використовується?

М: — У нас звичайний JavaScript і React з Redux

Ф: — А чому обрали саме їх?

М: — Коли ми почали писати Storyline, я React не використовував. До цього я писав на Angular 1.4, 1.5. Трошки тикав другий Angular, який на TypeScript. Коли ми почали Storyline, React вже виграв війну, тому було перспективніше писати на ньому (і простіше, як мені здається вже зараз). Тому я просто загуглив React Tutorial, пару днів у нього повтикав, зав’язав дефолтний генератор від Дена Абрамова, і там був вже Redux. Зараз не шкодую, хоча у мене і не було особливо досвіду з іншими бібліотеками.

Ф: — Можеш в парі слів сказати про архітектуру?

М: — Все досить просто, у нас Single-page application на React. Рейки використовуються для двох речей. Перше, це апишка для клієнтського додатку. Друге — хостинг для скілів, які створюються юзерами через Storyline.

Фронт складається з двох великих компонентів. Перша це Dashboard і все всередині проекту, а друге — редактор скілу. Він уже написаний з вкрапленнями d3.js. Там малюються блоки — треба, щоб все це було швидко, супер інтерактивно і красиво, щоб можна було стрілочки всякі малювати, анімації і так далі. Нам це було супер важливо, тому що у нас по суті тул для візуального програмування.

А Alexa, можна сказати, працює як звичайний бот в Telegram або Facebook. Ти їй даєш якийсь эндпоінт, якийсь сервачок. Як тільки юзер починає говорити з Алексою, вона шле тобі запити. Ти працюєш як проксі — тобі приходить запит, ти на нього відповідаєш. Алекса твою відповідь форматує і його вимовляє. Нічого надприродного — звичайне монолітне рейковий додаток, все працює на Amazon Web Services. Ми намагаємося робити все стандартно — React, Redux, Ruby on Rails — так простіше знайти розробників.

Ф: — Яка частина зараз здається найскладнішою?

М: — І технічно, і концептуально складною здається реалізація кроссплатформенності. Зараз ми підтримуємо тільки Алексу, потім будемо і Google home і Cortana, та інші штуки. Чесно кажучи, до цього ми ще ніяк технічно підготовлені. Думаю, там будуть великі проблеми, і це буде величезний челлендж.

Ф: — Можеш сказати, скільки зараз рядків коду в самому великому файлі на проекті?

М: — На фронтэнде напевно рядків 700 — є там один файл. На бэкенде, напевно поменше (я просто на Ruby краще пишу). Там може 250-300.

Як влаштовані програми в акселераторах і як проходить життя в Кремнієвій долині


Тім Дрейпер

Ми жили в Сан-Матео в Каліфорнії, в Draper University. Його побудував батько нашого інвестора Адама Тім Дрейпер. Він там один з найвідоміших чуваків. Його навіть називають батько-засновник долини. Він купив готель і зробив з нього університет, де два рази на рік проходить своя програма. Там жили і ми, і інші компанії. А тим, хто бере участь Boost VC, вони дають безкоштовне житло на чотири місяці.

Це дуже вагома грошова плюшка, тому що ціни в Сан-Франциско… Він ще й місце для офісу дає у своєму спейс, буквально в 10 метрах від житла — тільки дорогу перейти. Так що типовий день виглядав так: встаєш, ідеш в Boost, виходиш вже вночі, переходиш дорогу і йдеш назад спати. Приблизно так виглядали 97% наших днів.

У YC і в Boost VC ніякої формальний програми немає. Ти не сидиш і не слухаєш лекції. Але щотижня спільні вечері, куди запрошують відомих хлопців. Там були фаундер Quora (який виявляється раніше був CTO у Facebook), хлопці з AirBnb, Amplitude, Zapier, Dropbox. Накривається величезний стіл, всі сидять, їдять, слухають, спілкуються.

Раз в два тижні проходять збори. Там всі діляться на групи, за якимось магічним параметрами — індустрії, технології і тд. Всього у нас було десь 40 компаній, і в нашу групу потрапили 14. У кожної групи є свої партнери. У нас це були Майкл Сайбел (CEO YC і фаундер Twitch) і Густаф Альцтромер (head of growth в Airbnb).

Ми збиралися і говорили, що робили за минулі два тижні, який прогрес з метрик, що будемо робити наступні два тижні. Третє питання завжди змінювалось, Які є проблеми, що заважає рости, як ми збираємося стати компанією на $1 млрд.

І якщо наступного разу ти не зробив, що запланував — говорити про це перед усією групою і партнерами дуже соромно. Це сильно мотивує рухатися вперед, ставить тебе на рейки, щоб ти ріс. Якщо ти кілька місяців поспіль ростеш на 50%, починає здаватися, що в наступному місяці вже неможливо буде вирости. І ось ти починаєш шукати всякі хитрощі, як це зробити будь-яким способом, звикаєш до цього і ростеш.
— В долині класне співтовариство, всім всім допомагають. А можна принести свій код комусь з топів розробки, показати, попросити ради?

М: — Я думаю, це буде виглядати трохи дивно. У тих чуваків з Slack можна попросити якоїсь ради, де не існує правильної відповіді. Можна посидіти, пофілософствувати. Вони можуть дати тільки раду зі своєї дзвіниці.

Але з програмуванням — ну не знаю. Все ж можна нагуглити, протестити, знайти на гітхабі. Не думаю, що якийсь супер крутий чувак буде проти, але це не особливо має сенс.

В: — Це має сенс в специфічних областях. Якщо ти робиш якусь штуку на машинному навчанні, і є чувак, який 20 років цим займався — то так, це буде супер корисно.

Ф: — Макс, як думаєш, як бути розробникам в стартапі порівняно з іншими сферами?

М: — Я знаю тільки, як бути фаундером, як розробник я до цього у стартапах не працював. Зараз я не вважаю себе саме розробником, тому що доводиться все менше і менше писати код і більше занурюватися в купу різних процесів — мало не до покупки води в офіс.

Але все одно розробником в стартапі бути дуже круто. Ти не просто пілішь фічі, який тобі замовник сказав, а сам можеш на них впливати, придумувати. Але це дуже великий стрес. Всі хочуть швидко, і ти сам теж. У аутсорсе ти можеш сказати «я витратив на завдання 10 годин», хоча насправді витратив 4, і все буде окей. Можеш просто сидіти і перебирати технології, переписувати один клас по багато разів, тестами всі покривати.

А тут ти сам контролюєш свій час. Завжди є інтерес зробити швидше, краще. В стартапі потрібно балансувати між купою різних штук.

Читайте також  Будуємо простий GraphQL API сервер express і nodeJS

Ф: — Доводилося якось підтверджувати свій скілл, щоб отримати інвестиції?

М: — Це може звучати сумно і прикро, але, мені здається, роль технологій була особливо не важлива. Думаю, у 95% стартапів так само, якщо ми не говоримо про складні технологічні компанії, у яких суть продукту це технології.

А у всіх інших технології відходять на другий план. Написати якусь штуку або додаток — багато розуму не треба. Є багато фреймворків, туториалов, це все досить зрозуміло і просто. А знайти придатну ідею і придатну аудиторію, встигнути зробити продукт, зрозуміти кому він потрібен — в рази-в рази складніше.

Мені здається, роль технологій у стартапах переоцінена в головах людей. Стек, швидко або повільно ти пишеш код — це все не так важливо. Набагато важливіше твоя стратегія, як ти знаходиш рішення.

— На що взагалі більше дивляться? На саму ідею або вашу здатність за неї вхопитися і довести до кінця?

В: — YC в першу чергу дивиться на фаундерів — скільки одиниць роботи ви можете виконати за одиницю часу. Головне наскільки швидко ти можеш робити, тестувати, розуміти що де не працює і що робити далі.

Друге, на що вони дивляться — це ринок. Якщо ти робиш дуже швидко, але на поганому ринку — далеко ти не уплывешь. На дуже великих ринках, як правило, висока конкуренція, тому вони намагаються знайти маленькі але швидко зростаючі. У нас, я вважаю, був ідеальний таймінг. Ми зробили продукт відразу, як тільки з’явилася можливість його зробити. А таймінг це одна з найважливіших штук.

І третє — це сам продукт. Їм важливо, щоб люди його полюбили. Краще робити продукт, який люблять сотні, ніж продукт, який подобається тисячам. Якщо він просто подобається, то буде важко перетворити. Набагато краще знайти маленьке співтовариство. Ми виросли з нуля до 14 тисяч юзерів органічно просто тому, що одні люди розповідали про нас іншим.

Буквально минулого тижня в нашій групі на Facebook написала людина зі своїм real estate бізнесом. Зараз популярне явище, коли люди дивляться вдома не з ріелтором, а самі. Він хотів зробити скілл для Alexa, поставити у всіх будинках по девайсу, щоб клієнти могли самі питати в неї про все. Він звернувся в агентство, щоб йому розробили такий скілл, і там попросили у нього $45 тис.

Він засмутився і пішов шукати, як зробити таку річ самому. Знайшов наш продукт і зробив цю штуку через яку агентство просило 45 тисяч — буквально за кілька днів. І ось він купив нашу платну версію, хоча йому навіть не були потрібні фічі, які там є (хороший привід для нас подумати над новими сегментами). Просто він полюбив продукт і підтримав нас.

Що буде з голосовими асистентами в найближчі роки

Всі бачили, як будують зазвичай будівлі. Огороджують територію, і там за парканом щось довго-довго роблять. Потім раптом за лічені тижні виростає остов цілого хмарочоса. З боку здається, що будівництво нарешті розігналося і ось-ось усе буде готово. Але коли кістяк побудований, робота наче б знову сповільнюється. Конструкцію ще довго облаштовують, поки не вийде готовий хмарочос.

З технологічними ринками також. Хороші готові продукти з’являються не в час галасу і хайпу. Вони з’являються потім, коли шум спадає. І тоді вони стають монополістами і міняють ринок.

Зараз голосові технології — це остов хмарочоса. Є хороша технологія розпізнавання. Що з’являється на ринку. У штатах 50 мільйонів проданих спікерів. Google actions можна запустити на будь-якому Андроїд-смартфоні, а це 86.2% ринку смартфонів. У Microsoft у світі 500 мільйонів пристроїв на Windows, і використання голосових технологій росте там на 50% від місяця до місяця.

Але це ще не хмарочос. Він з’явиться, коли з’являться нові круті юзкейсы для голосових помічників (наприклад, замовлення товарів і послуг голосом), коли у людей буде розвиватися звичка їх використовувати. Це буде через 18-24 місяці. Ось тоді на ринку почнуть відбуватися більш цікаві штуки.

А через 3-5 років вже буде приблизно так: ти прокидаєшся, у тебе біля ліжка стоїть девайс. Ти кажеш, «Алекса, добрий ранок». Вона включає твою улюблену пісню, варить тобі кави, відкриває вікна. Йдеш на кухню, запускаєш голосом підкаст або новини. Сідаєш в машину, їдеш на роботу, дослухуєш підкаст там. Асистент перетворюється в безшовну операційну систему.

Всі кажуть, що навколо голосових технологій хайп, але він ще навіть не розпочався. Хайп почнеться через рік-півтора, і тоді буде реально цікаво. Вже в наступному році BMW і Lexus будуть виходити з вбудованою Алексою. В Америці Amazon інтегрує Алексу в ТВ-приставки, тобто вона вже стає ТВ-пультом. Під Алексу є вже близько 40 тисяч додатків, і пару тижнів тому Амазон зробив штуку, яка дозволяє запускати їх не вимовляючи назву. Тобто ти кажеш «Алекса, замов квіти, і вона сама підбирає додатки, які можуть це зробити». Мені здається, це буде номер один річчю в майбутньому. Спочатку не треба буде вимовляти назву програми, потім і ім’я асистента. Він буде в режимі «always listening» і контекстно розуміти, якщо ти до нього звертаєшся.

— Тобі цікава була тема лінгвістики — навчити комп’ютер говорити, все таке?

В: — Так, це дуже прикольно. Я пам’ятаю в Стартреці був комп, з якими вони говорили. Це було забавно, але здавалося таким футуристичним. І ось це вже відбувається насправді.

Є історія. Я їду з роботи на тренування, сідаю в убер, а там водій з кимось розмовляє. Дивлюся — в машині нікого немає. Виявилося, він говорив з Алісою в Яндекс Навігаторі. І ось ззаду підпер його якийсь чувак. Водій почав лаятися, а Аліса подумала, що він на неї лається — каже йому: «так як ви зі мною розмовляєте?». Водій такий, «заткнися там, взагалі не до тебе». Це виглядало настільки реально. Думаєш, що майбутнє десь далеко, а тут, вже настав.

Звичайно те, наскільки девайси і помічники можуть контекстно відповідати, ще далеко від ідеалу. Але розпізнавання мови все краще. Якщо зараз Алекса вірно розуміє 8 слів з 10 (за моїми відчуттями), то через кілька років буде розуміти всі 10. Це дуже сильно вплине на те, як люди будуть розмовляти зі своїм девайсом. Ось Siri супер тупа, не розуміє взагалі нічого, і це сильно виводить з себе. Голосовий помічник такий продукт — щоб він добре працював, повинна бути хороша сама технологія.

— Тобі не хотілося б прив’язати якесь навчання, щоб алекса розуміла не буквально, що ти їй говориш, а використовувала контекст?

В: — Частково це працює в Storyline зараз. Наприклад, є интент YES/NO, і до них додається купа синонімів на стороні Амазона. Якщо ти ставиш Yes, Алекса зрозуміє Ok, Fine, True і так далі. Все це робиться на рівні Алекси, а ми використовуємо її як інтерфейс.

— Коли взагалі машини заговорять краще ніж ми?

В: — Це питання про штучний інтелект в цілому. Тест Тюрінга зараз цілком можливо пройти, спеціально натренувати систему під вузьку задачу. Але краще говорити людини — це значить розуміти контекст, емоції, інтонації, комбінувати все, щоб видавати відповідь. Я не знаю, мені дуже важко це уявити.

Я можу бути повністю неправий, але мені здається не раніше, ніж років через 10-15.

Степан Лютий

Обожнюю технології в сучасному світі. Хоча частенько і замислююся над тим, як далеко вони нас заведуть. Не те, щоб я прям і знаюся на ядрах, пікселях, коллайдерах і інших парсеках. Просто приходжу в захват від того, що може в творчому пориві вигадати людський розум.

You may also like...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *