СТАРТАПИ

«Шерлоки» у світі наукових даних. Як працює український стартап knowledgator engineering

Юлія Ткач 16 октября 2023, 09:00

У рамках рубрики «Хто ці люди» Vector дає можливість засновникам розповісти про свій проєкт. Цього разу на «трибуні» команда українського стартапу knowledgator engineering. Їх продукт — пошукова NLP-система на основі ШІ. Вона допомагає дослідникам знаходити необхідну інформацію з наукових і клінічних даних для розробок і конкурентної розвідки в галузі Life Science (наук про життя). Команда knowledgator була у складі української делегації, що представляла Україну на конференції Startup Grind Global 2023 в Кремнієвій долині.

Журналістка Vector Юлія Ткач розпитала співзасновника та CОO стартапу Валерія Василевського про особливості продукту, просування, інвестиції та подальші плани.

Ідея та команда

У knowledgator engineering четверо співзасновників:

Василевський та Степанов зустрілися на науковій виставці. «Ігор тоді займався невеличкою аналітичною компанією разом з нашим теперішнім CTO Максимом Ніколаєнко. Я був директором просвітницької громадської організації. Всі троє з Life Science. Ми з Максимом за освітою лікарі, а Ігор — біотехнолог. Чітко розуміли проблему неефективності наукових досліджень, адже безпосередньо з цим стикались. Тому вирішили спробувати розробити рішення для автоматизації збору та структурування таргетної наукової інформації», — пояснює Василевський. 

Далі Василевський запропонував теперішньому продуктовому директору Тарасу Ставничому приєднатися до ініціативи. Він мав достатній корпоративний досвід, якого їм не вистачало. Крім чотирьох засновників, в команді троє співробітників. Ще трьох нещодавно скоротили, адже мали забагато напрямків досліджень. 

Головний фокус зараз на ШI. За цей напрямок відповідають CEO і Deep Learning інженер. CTO керує іншими напрямками розробки. СОО бере за операційне управління, фандрейзинг та продажі. CPO — брендинг, дослідження ринку та просування продукту.

Продукт 

knowledgator engineering — пошукова NLP-система на основі ШІ для збору інформації, що перетворює неструктурований текст у динамічні бази даних. Вона допомагає знаходити необхідну інформацію з наукових і клінічних даних для досліджень та розробок і конкурентної розвідки в галузі Life Science. 

Компанія продає набір моделей ШІ у вигляді API. Також виконують різні етапи збору, структурування та аналізу наукових даних в сфері медицини, біотехнології та фармацевтики. 

Серед них: 

«Проблема полягає в тому, що головні наукові бази даних типу Medline та Clinical Trials.gov дуже консервативні та нестандартизовані. Це ускладнює автоматизацію аналітики. Наприклад, для збору інформації про потенційні молекулярні таргети для лікування певного захворювання. 

За нашими даними, вчені або користуються дуже застарілими методами, або купують кінцеві платформи для дослідження та розробки за мільйони доларів. Це доступно виключно для великих фармкомпаній. В той же час такі рішення недостатньо гнучкі. Тому великі фармкомпанії розробляють власні. Ми стараємось продавати окремі компоненти пайплайну обробки даних, але розробляти їх максимально точними та спеціалізованими», — пояснює Василевський. 

Стартап запустили в грудні 2021-го. На створення MVP пішло близько шість місяців. Загалом на анотацію даних (перш за все наукових статей, біотех новин, клінічних випробувань та патентів) витратили орієнтовно 1200 людино-годин. Наразі knowledgator перебуває на seed-стадії. Розроблено 70% таргетних технологій — ШІ-моделі, натреновані з нуля. 

Аудиторія

Цільова аудиторія продукту — фармацевтичні, біотехнологічні та дослідницькі компанії, які займаються аналізом біомедичних даних. 

«Це компанії, що змушені одночасно збирати та аналізувати величезні масиви гетерогенних даних, які неможливо точно опрацювати загальними рішеннями, як-от GPT. Основна причина — подібні моделі спрямовані на загальний домен та не були натреновані на достатній кількості медико-біологічних даних. Також вони часто галюцинують. Наприклад, коли потрібно зібрати інформацію про всі фармацевтичні компанії, які збільшили інвестиції в гематологічні препарати», — пояснює СОО. 

Географія поки необмежена, все ще шукають нішу.

Бізнес-модель 

Працюють за моделями: 

«Наша основна бізнес-модель — pay-as-you-go. Користувачі платять за кількість токенів, які використовують. 1 токен — близько 0,75 слів. Чим більше людина використовує токенів, тим нижча ціна за 1 монетку. Це доволі стандартно для нашої індустрії. Для корпоративних клієнтів ми також пропонуємо сервіси з інтеграції наших рішень та розробки пайпланів обробки даних на основі наших API», — пояснює Василевський

За його словами, стартап має кількох B2B-клієнтів, та ще два пілотні проєкти з біотехнологічними компаніями.

Інвестиції та маркетинг

Засновники вклали $3000-5000 в приблизно рівних обʼємах у сервери, створення перших датасетів, сайту тощо. Також залучили 55 000 євро від європейського акселератора Startup Wise Guys. Ще $35 000 — грант від Українського фонду стартапів. Невдовзі планують відкривати seed-раунд на $360 000. Гроші використають для завершення продукту та збільшення продажів.

Просувають свій продукт, перш за все, через аутріч в LinkedIn. Також останнім часом фокусуються на SEO. Плюс розмістили свої API на RapidAPI, HuggingFace та інших маркетплейсах. 

Плани

«Зараз головна мета — відточити API, щоб максимально відірватися від конкурентів та розробити платформу, де користувачі зможуть самостійно оптимізувати наші моделі під свої потреби. Їхня специфіка дозволить це робити максимально дешево. Це дасть нам змогу зробити бізнес-модель піддатливішою для масштабування», — фіналізує Василевський.

Читайте также