Читати книгу - "Пришестя роботів: техніка і загроза майбутнього безробіття"
Шрифт:
Інтервал:
Добавити в закладку:
Одначе тут існує й потенційна темна сторона. Компанія Target, Inc. надала значно суперечливіший приклад того, як можна використовувати великі масиви безпрецедентно детальної інформації про покупців і клієнтів. Спеціаліст з обробки даних, який працює у вищезгаданій компанії, виявив складну сукупність взаємозв’язків, яка стосується покупки приблизно двадцяти п’яти різноманітних медичних і косметичних препаратів, що є потужними передвісниками вагітності. Здійснений цією компанією аналіз навіть забезпечував можливість із високою точністю передбачити дату пологів у тієї чи іншої конкретної жінки. І Target, Inc. почала бомбардувати жінок пропозиціями товарів, пов’язаних з вагітністю, на такій ранній стадії, що деякі жінки ще навіть не встигли повідомити про свою вагітність членам своєї родини. В одній статті, опублікованій на початку 2012 року в газеті New York Times, повідомлялося про випадок, коли батько дівчинки-підлітка навіть поскаржився керівництву магазину на зміст рекламного листа, який прийшов на їхню адресу, та згодом дізнався, що в компанії Target насправді про його доньку знали значно більше, ніж він сам [7]. Дехто з критиків висловлює побоювання, що ця обурлива історія є лише початком і що великі масиви даних дедалі частіше використовуватимуться для здійснення прогнозів і передбачень, потенційно здатних зазіхнути на приватне життя людей і навіть на їхню свободу.
Результати, отримані після аналізу великих масивів даних, типово ґрунтуються на кореляційних зв’язках і жодним чином не з’ясовують причину досліджуваного феномену. Алгоритм може встановити, що коли А є правильним, то В також, скоріш за все, буде правильним. Однак він не може сказати, що А є причиною В, чи навпаки, або що як А, так і В спричинені якимось зовнішнім чинником. Однак у багатьох випадках, а особливо в сфері бізнесу, де мірою успіху є прибутковість і продуктивність, а не глибоке розуміння, одні лише кореляційні зв’язки самі по собі можуть набувати екстраординарної вартості. Великі масиви даних можуть забезпечити керівництву безпрецедентний рівень аналітичного проникнення до широкого спектру напрямків: усе, починаючи з функціонування окремої машини і закінчуючи загальними показниками роботи багатонаціональної корпорації, можна проаналізувати так детально, як раніше це було просто неможливо.
Незмірний обсяг даних, що зростає, дедалі частіше розглядається як ресурс, з якого можна видобувати цінності — як нині, так і в майбутньому. Так само, як і видобувні галузі на зразок газової та нафтової безперервно отримують зиск з технічного прогресу, можна майже напевне прогнозувати, що зростання потужності комп’ютерів та удосконалення прийомів програмування й аналізу забезпечать корпораціям можливість отримати нові аналітичні результати, які безпосередньо спричиняться до підвищення прибутковості. І дійсно, мабуть саме такі прогнози з боку інвесторів забезпечують інформаційномістким компаніям на зразок Facebook таку високу вартість їхніх цінних паперів.
Одним з найефективніших способів видобування зазначених цінностей є навчання машин — процедура, під час якої комп’ютер фільтрує дані і, фактично, прописує власну програму, яка базується на виявлених ним статистичних взаємозв’язках. Машинне навчання проходить, зазвичай, у два етапи: спершу алгоритм налаштовують на вже відомі дані, а потім спрямовують на розв’язання аналогічних проблем в новому масиві інформації. Один з поширених способів використання машинного навчання — це фільтр спаму в електронній пошті. Алгоритм можна навчити обробляти мільйони електронних листів, які завчасно ідентифіковані (або не ідентифіковані) як спам. Ніхто не займається безпосереднім програмуванням системи для розпізнавання всіх мислимих варіантів слова «Віагра». Натомість цим займається саме програмне забезпечення. І в результаті з’являється комп’ютерна програма, здатна автоматично визначати більшість непотрібної пошти, а також безперервно оновлюватися й адаптуватися з тим, як з’являються нові варіанти спаму. Алгоритми машинного навчання, основою яких є однакові базові принципи, рекомендують книги на сайті Amazon.com, кінофільми на Netflix і потенційні партнери на сайті знайомств Match.com.
Одна з найяскравіших демонстрацій можливостей машинного навчання відбулася тоді, коли компанія Google запровадила свій інтернет-перекладач з різних мов. У його алгоритмах був застосований принцип розв’язання проблеми, який можна було б назвати принципом розетського каменя і який полягав у аналізі й порівнянні мільйонів сторінок тексту, що раніше вже перекладалися безліччю мов. Команда програмістів компанії Google почала з того, що зосередилася на офіційних документах, підготовлених в ООН, а потім поширила свої зусилля на інтернет, де пошуковий двигун цієї компанії зміг знаходити величезну кількість конкретних прикладів, які стали «поживним кормом» для ненажерливих самонавчальних алгоритмів. Проти тієї кількості документів, що використовуються для навчання системи, зійшло нанівець все, що з’явилося раніше. Франц Ох, учений-комп’ютерник, який керував цим проектом, зазначив, що група створила «дуже-дуже великі лінгвістичні моделі, значно більші за ті, які коли-небудь були створені за всю історію людства» [8].
У 2005 році компанія Google виставила свою систему на щорічний чемпіонат машинних перекладачів, організований Національним Бюро стандартів і технології (National Bureau of Standards and Technology) — агенцією, що є одним із підрозділів Міністерства торгівлі Сполучених Штатів і яка публікує вимірювальні стандарти. Ґуґлівським алгоритмам машинного навчання вдалося з легкістю взяти гору над своїми конкурентами, які, зазвичай, намагалися активно програмувати свої перекладацькі системи, продираючись крізь хащі суперечливих і непослідовних граматичних правил, характерних для кожної мови. Головний урок полягає в тому, що коли конкретний масив даних стає надто великим, то він часто може звести нанівець усі зусилля навіть найкращих програмістів. Система Google іще неспроможна скласти конкуренцію досвідченим перекладачам у людській подобі, проте вона забезпечує двосторонній переклад у понад 500 мовних пар. Це означає дійсно дестабілізаційний прогрес у комунікативній здатності: вперше в історії людства нині майже кожен має змогу вільно й миттєво отримати грубий переклад практично будь-якого тексту з будь-якої мови.
Хоча існує цілий ряд різноманітних принципів машинного навчання, одна з найпотужніших і доволі цікавих технологій передбачає використання штучних нейронних мереж або систем, створених за тим же фундаментальним робочим принципом, що й мозок людини. Мозок містить аж 100 млрд нервових клітин, поєднаних багатьма трильйонами зв’язків, але потужні навчальні системи можна побудувати з використанням значно простіших конфігурацій симульованих нейронів.
Окремий нейрон працює майже як пластмасові іграшки-стрибунці, популярні серед малих дітей. Коли дитинча натискає кнопку, вистрибує яскрава кольорова фігурка, можливо — якийсь мультиплікаційний персонаж або тваринка. А якщо натиснути кнопку потихеньку, то
Увага!
Сайт зберігає кукі вашого браузера. Ви зможете в будь-який момент зробити закладку та продовжити читання книги «Пришестя роботів: техніка і загроза майбутнього безробіття», після закриття браузера.