ТЕХНОЛОГІЇ

Секретна зброя проти росії чи загроза? Як працює «Shazam для облич» Clearview AI

Надія Баловсяк 7 декабря 2023, 09:00

У грудні 2022-го міністр цифрової трансформації України Михайло Федоров розповів, що інструментом для розпізнавання облич американської компанії Clearview AI користується понад 900 людей з семи державних органів. Вони здійснили понад 125 000 пошукових запитів для ідентифікації російських військових злочинців. У квітні 2023-го стало відомо, що в Clearview зацікавлені в розбудові цифрової інфраструктури України. Зокрема, компанія розглядає варіант відкрити офіс в Україні з локальною командою розробки. 

Однак у нашій країні загалом мало знають про Clearview, особливості її роботи та ризики використання. Про все це розповідає журналістка Надія Баловсяк.

Що робить Clearview AI

Clearview AI була заснована в 2017 році австралійським розробником Хоан Тон-Татом та американським політиком Річардом Шварцом. Компанія підняла $38,6 млн. Зокрема, від венчурного інвестора Пітера Тіля, який також є співзасновником Palantir.

Достатньо довгий час про компанію не було майже нічого відомо. Її першим значним виходом в паблік став матеріал Кашмір Хілл для The New York Times у січні 2020-го. Він отримав гучний заголовок «Таємна компанія, яка може покласти край конфіденційності, як ми її знаємо». 

Занепокоєння викликав інструмент Clearview AI, який дозволяє за допомогою фотографії відшукати облікові записи людини в соцмережах, профілі на сайтах пошуку роботи й навіть випадкові потрапляння на знімки незнайомців. 

У Clearview AI кажуть, що мають найбільшу в світі базу даних, до якої входить понад 40 млрд зображень облич.

Для створення останньої компанія зробила скрепінг публічно доступних знімків з сайтів, фотобанків та соцмереж. Цей величезний датасет дозволяє системі розпізнавання працювати з точністю близькою до 100%. Принаймні про показник в 99,85% заявив сам Хоан Тон-Тат, посилаючись на Національний інститут стандартів та технологій США (NIST). Фактично Clearview AI здатна ідентифікувати практично будь-яку особу, чиє зображення та ім’я можна було знайти на Facebook, LinkedIn, Twitter, Instagram тощо. 

Після створення бази даних та алгоритму, 2017-го компанія зосередилася на продажі свого продукту американським правоохоронним органам. Найефективнішою технікою продажу компанії була пропозиція 30-денних безоплатних пробних версій офіцерам. Ті потім заохочували свої відділи закупівель виділити на це кошти, а також ділилися інформацією про неймовірно ефективний інструмент на професійних конференціях. 

Поки правоохоронці хвалили рішення Clearview AI, воно все одно залишалося в тіні. Все змінила вищезазначена публікація Кашмір Хілл для The New York Times. Вона стала початком критичного висвітлення Clearview AI як «моторошного», «жахливого» та «антиутопічного» інструменту. 

Це поклало початок хвилі судових позовів та штрафів. Технологічні гіганти Meta, Google, LinkedIn, Twitter вимагають в Clearview не використовувати їхні дані. А ще Clearview звинуватили в порушенні GDPR Загальний регламент про захист даних — регламент в межах законодавства Європейського Союзу щодо захисту персональних даних усіх осіб у межах Європейського Союзу та Європейської економічної зони. в ЄС, а також заборонили продавати доступ до своєї бази даних приватним компаніям США. 

Сіра зона у етиці використання технологій 

Кашмір Хілл також написала книгу про Clearview з вельми промовистою назвою  «Твоє обличчя належить нам: прагнення секретного стартапу покінчити з конфіденційністю, якою ми її знаємо». 

У ній авторка пояснює, що насправді Clearview AI не здійснила технологічний прорив. Вона наголошує на тому, що інструменти для розпізнавання існували по суті є у відкритому доступі в інтернеті: «Те, що зробила Clearview AI, було не технологічним проривом, а радше етичним кроком. Вони були готові зібрати ці фотографії та створити радикальний інструмент, який інші компанії вважали табу». 

Щобільше, як стверджує авторка, ще понад 10 років тому, свого часу Facebook та Google розробили схожі інструменти розпізнавання, але вирішили притримати їх. За словами вже екс-CEO Google Еріка Шмідта, ця технологія була єдиною, яку його компанія створила, але зрештою визнала надто небезпечною для релізу. 

Проте опосередкована провина Facebook (та й інших соціальних платформ) полягає в тому, що багато фотографій, зібраних на їхніх сторінках, були використані Clearview AI. Саме завдяки Instagram чи Facebook стало можливим пов’язати людину з її обліковим записом через доступне онлайн-фото. Тобто фактично деанонімізувати. Кашмір Хілл вважає, що Meta могла би зробити більше, щоб запобігти цьому. 

Амбіції Clearview AI, схоже, не закінчуються на зазначених вище 40 млрд зображень. У презентації інвесторам на грудень 2021-го йшлося, що протягом року Clearview досягне майже 100 млрд зображень. Цього достатньо, щоб можна було ідентифікувати «майже кожну людину у світі». Поки компанія не досягла такого показника, принаймні за офіційними даними.

Як Clearview AI застосовують в Україні 

Про використання Clearview AI в Україні стало відомо у перший місяць війни, у березні 2022 року. Хоан Тон-Тат сам запропонував безоплатні навчання та доступ до Clearview. На той момент база даних компанії містила понад 2 млрд зображень з російських соціальних мереж на кшталт «ВКонтакте». 

«Технологія може допомогти в цей час жахливого конфлікту, — зазначав Хоан Тон-Тат, — щоб запобігти шкоді, врятувати невинних людей і захистити життя».

Уже за два тижні після першої демонстрації інструменту співробітники компанії проводили навчання для українських поліцейських. 

Time розповідає про використання Clearview AI в Україні для сайту «Потерь.нет» —  наповнення бази даних з іменами загиблих російських солдатів. Clearview допомогла ідентифікувати їх, щоб змогли знайти родичі. 

Іншим прикладом корисного використання Clearview AI може стати збір доказів для майбутнього переслідування військових злочинців. Принаймні їхньої ідентифікації разом із показами свідків. Clearview AI також почали використовувати, аби визначити учасників «сил самооборони Криму», які допомогли росії окупувати півострів. Використовуючи Clearview, прокуратура швидко ідентифікувала понад 70 осіб, що дало змогу заарештувати їх, коли вони в’їхали на територію України.

Третій напрям, у якому Clearview AI став корисним — виявлення викрадених українських дітей, яких примусово забрали з дитячих будинків і тимчасових притулків. Частину з них усиновили російські родини або їх відправили до «перевиховних таборів». У Time згадують про те, що завдяки інструменту прокуратура змогла ідентифікувати 198 зниклих дітей, підтвердити, що вони перебували в росії або на окупованих нею територіях. Також вдалось ідентифікувати їхніх «прийомних батьків».

Дві сторони однієї технології 

Використання Clearview AI в Україні показало, що насправді цей інструмент не лише ефективний, але й у певних випадках дуже корисний. Проте занепокоєння викликає те, що Clearview AI збирається допомагати розбудовувати цифрову інфраструктуру Україні. В нашій країні використовуються дещо застарілі закони щодо захисту персональних даних.

Тому поява на ІТ-горизонті такого гравця як Clearview AI несе потенційні ризики для приватності громадян. 

Time цитує Хуана Еспіндолу, дослідника з Національного автономного університету Мексики (UNAM). Він переконаний, що використання розпізнавання облич та інші цифрові інструменти вплине на те, як інші країни вирішать ставитися до конфіденційності громадян в часи кризи. «Це слизька доріжка. Урядовці завжди знайдуть спосіб виправдати дедалі ширше використання таких інструментів, коли вони перебувають у стані війни. Але тоді це перетворюється на нескінченну війну. Навіть якщо вторгнення закінчиться, загроза існуватиме завжди», — вважає Еспіндола.

Тон Тат своєю чергою сподівається, що використання технології в Україні переконає критиків: його компанія насправді на боці добра. «У майбутніх конфліктах часто використовуватиметься розпізнавання облич. Війна — це жахливо, чи не так? Якби цих воєн не існувало, людям би не знадобилося щось на зразок Clearview», — каже підприємець.

У підсумку застосування та подальші плани Clearview в Україні гостро поставлять питання щодо обмеження застосування інструменту та переосмислення законодавства щодо захисту персональних даних. Нам варто думати про це ще до закінчення війни.