СТАРТАПИ

«Шерлоки» у світі наукових даних. Як працює український стартап knowledgator engineering

16 Жовтня 2023, 09:00
7 хв читання
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
Додати в закладки

Будь-яку статтю можна зберегти в закладки на сайті, щоб прочитати її пізніше.

Юлія Ткач Керую відділом новин, популяризую підприємництво, надихаю конкурентів та вірю в український бізнес.
Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.
Режим читання

Режим читання збільшує текст, прибирає все зайве зі сторінки та дає можливість зосередитися на матеріалі. Тут ви можете вимкнути його в будь-який момент.

У рамках рубрики «Хто ці люди» Vector дає можливість засновникам розповісти про свій проєкт. Цього разу на «трибуні» команда українського стартапу knowledgator engineering. Їх продукт — пошукова NLP-система на основі ШІ. Вона допомагає дослідникам знаходити необхідну інформацію з наукових і клінічних даних для розробок і конкурентної розвідки в галузі Life Science (наук про життя). Команда knowledgator була у складі української делегації, що представляла Україну на конференції Startup Grind Global 2023 в Кремнієвій долині.

Журналістка Vector Юлія Ткач розпитала співзасновника та CОO стартапу Валерія Василевського про особливості продукту, просування, інвестиції та подальші плани.

Ідея та команда

У knowledgator engineering четверо співзасновників:

  • Валерій Василевський (СОО). Заснував Campus, маркетплейс для студентів для обміну навчальними матеріалами, знаннями та досвідом. Проєкт підняв ангельські інвестиції, але зазнав невдачі.
  • Ігор Степанов (CEO) та Максим Ніколаєнко (СТО). З 2019 по 2021 роки розвивали свій проєкт Bionet (Biological Novel Exponential Technologies Association). Це неурядова організація, спільнота науковців, підприємців, інвесторів та студентів. Її мета — розвиток біотехнологій та підприємництва у цій сфері.
  • Тарас Ставничий (СРО). Згідно з LinkedIn, має понад п’ять років досвіду як Android Developer.

Василевський та Степанов зустрілися на науковій виставці. «Ігор тоді займався невеличкою аналітичною компанією разом з нашим теперішнім CTO Максимом Ніколаєнко. Я був директором просвітницької громадської організації. Всі троє з Life Science. Ми з Максимом за освітою лікарі, а Ігор — біотехнолог. Чітко розуміли проблему неефективності наукових досліджень, адже безпосередньо з цим стикались. Тому вирішили спробувати розробити рішення для автоматизації збору та структурування таргетної наукової інформації», — пояснює Василевський. 

Далі Василевський запропонував теперішньому продуктовому директору Тарасу Ставничому приєднатися до ініціативи. Він мав достатній корпоративний досвід, якого їм не вистачало. Крім чотирьох засновників, в команді троє співробітників. Ще трьох нещодавно скоротили, адже мали забагато напрямків досліджень. 

Головний фокус зараз на ШI. За цей напрямок відповідають CEO і Deep Learning інженер. CTO керує іншими напрямками розробки. СОО бере за операційне управління, фандрейзинг та продажі. CPO — брендинг, дослідження ринку та просування продукту.

Продукт 

knowledgator engineering — пошукова NLP-система на основі ШІ для збору інформації, що перетворює неструктурований текст у динамічні бази даних. Вона допомагає знаходити необхідну інформацію з наукових і клінічних даних для досліджень та розробок і конкурентної розвідки в галузі Life Science. 

Компанія продає набір моделей ШІ у вигляді API. Також виконують різні етапи збору, структурування та аналізу наукових даних в сфері медицини, біотехнології та фармацевтики. 

Серед них: 

  • Named Entity Recognition — виявлення в тексті обʼєктів як-от білки, гени, хвороби, люди, компанії, та інші значущі сутності.
  • Tabular Information Extraction — інструмент, який «читає» текст та автоматично заносить інформацію з нього до створеної користувачем таблиці.

«Проблема полягає в тому, що головні наукові бази даних типу Medline та Clinical Trials.gov дуже консервативні та нестандартизовані. Це ускладнює автоматизацію аналітики. Наприклад, для збору інформації про потенційні молекулярні таргети для лікування певного захворювання. 

За нашими даними, вчені або користуються дуже застарілими методами, або купують кінцеві платформи для дослідження та розробки за мільйони доларів. Це доступно виключно для великих фармкомпаній. В той же час такі рішення недостатньо гнучкі. Тому великі фармкомпанії розробляють власні. Ми стараємось продавати окремі компоненти пайплайну обробки даних, але розробляти їх максимально точними та спеціалізованими», — пояснює Василевський. 

Стартап запустили в грудні 2021-го. На створення MVP пішло близько шість місяців. Загалом на анотацію даних (перш за все наукових статей, біотех новин, клінічних випробувань та патентів) витратили орієнтовно 1200 людино-годин. Наразі knowledgator перебуває на seed-стадії. Розроблено 70% таргетних технологій — ШІ-моделі, натреновані з нуля. 

Аудиторія

Цільова аудиторія продукту — фармацевтичні, біотехнологічні та дослідницькі компанії, які займаються аналізом біомедичних даних. 

«Це компанії, що змушені одночасно збирати та аналізувати величезні масиви гетерогенних даних, які неможливо точно опрацювати загальними рішеннями, як-от GPT. Основна причина — подібні моделі спрямовані на загальний домен та не були натреновані на достатній кількості медико-біологічних даних. Також вони часто галюцинують. Наприклад, коли потрібно зібрати інформацію про всі фармацевтичні компанії, які збільшили інвестиції в гематологічні препарати», — пояснює СОО. 

Географія поки необмежена, все ще шукають нішу.

Бізнес-модель 

Працюють за моделями: 

  • B2B — прямі холодні продажі, пропонують свої API та допомагають з інтеграцією;
  • B2B2C — через маркетплейси/платформи (RapidAPI), де продають підписку на API.

«Наша основна бізнес-модель — pay-as-you-go. Користувачі платять за кількість токенів, які використовують. 1 токен — близько 0,75 слів. Чим більше людина використовує токенів, тим нижча ціна за 1 монетку. Це доволі стандартно для нашої індустрії. Для корпоративних клієнтів ми також пропонуємо сервіси з інтеграції наших рішень та розробки пайпланів обробки даних на основі наших API», — пояснює Василевський

За його словами, стартап має кількох B2B-клієнтів, та ще два пілотні проєкти з біотехнологічними компаніями.

Інвестиції та маркетинг

Засновники вклали $3000-5000 в приблизно рівних обʼємах у сервери, створення перших датасетів, сайту тощо. Також залучили 55 000 євро від європейського акселератора Startup Wise Guys. Ще $35 000 — грант від Українського фонду стартапів. Невдовзі планують відкривати seed-раунд на $360 000. Гроші використають для завершення продукту та збільшення продажів.

Просувають свій продукт, перш за все, через аутріч в LinkedIn. Також останнім часом фокусуються на SEO. Плюс розмістили свої API на RapidAPI, HuggingFace та інших маркетплейсах. 

Плани

«Зараз головна мета — відточити API, щоб максимально відірватися від конкурентів та розробити платформу, де користувачі зможуть самостійно оптимізувати наші моделі під свої потреби. Їхня специфіка дозволить це робити максимально дешево. Це дасть нам змогу зробити бізнес-модель піддатливішою для масштабування», — фіналізує Василевський.

Знайшли помилку? Виділіть її і натисніть Ctrl+Enter

ЧИТАЙТЕ ТАКОЖ
Досвід і думки
ШІ від Meta та OpenAI починає думати? Дайджест технологічних новин від Roosh Ventures
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
21 Квітня 2024, 13:00 6 хв читання
Досвід і думки
Ажіотаж, халвінг та ETF. Чому «злетів» біткоїн та що буде далі
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
18 Квітня 2024, 09:00 5 хв читання
Досвід і думки
Роботаксі від Ілона Маска. Дайджест новин технологій від Roosh Ventures
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
14 Квітня 2024, 13:00 6 хв читання
Досвід і думки
Знати свій продукт — мало. Як говорити з інвесторами так, щоб отримати кошти
Матеріал успішно додано в закладки Досягнуто максимальної кількості закладок
23 Березня 2024, 16:04 5 хв читання
Завантаження...