Google буде генерувати оригінальний контент з вмісту сайтів

Google тестує новий алгоритм, який здатний брати вміст різних сайтів і на його основі створювати «логічно узгоджені» статті. Генеруючи оригінальний контент, новий алгоритм може відповідати на питання користувачів, не перенаправляючи їх на інші сайти.

&Nbsp;

Як працює новий алгоритм

На першому етапі новий алгоритм узагальнює веб-контент, використовуючи алгоритм, який «витягує» контент сайту, а потім відсікає нерелевантні частини — подібно алгоритмам, які використовуються для створення готових відповідей (featured snippets).

Результати, що генеруються за допомогою цього алгоритму, в статті називаються » витягуються зведеннями » Extractive Summaries), оскільки вони складаються з контенту, витягнутого з веб-сторінок. По суті, ці зведення являють собою вибірку найважливіших пропозицій, що мають відношення до питання користувача.

На другому етапі новий алгоритм використовує ще один вид алгоритму під назвою Abstractive Summary, який є формою перефразування. Недоліком штучного перефразування є той факт, що практично третина таких зведень містить фейкові факти.

Відповідно до статті, дослідники Google знайшли спосіб об’єднати кращі сторони обох підходів. Вони використовують Extractive Summaries для вилучення найважливіших фактів з веб-документів, а потім застосовують Abstractive Summary для перефразування цього контенту. В результаті виходить новий документ, заснований на інформації, знайденої в Інтернеті. Таким чином Google створює власну версію Wikipedia.

Featured Snippets — це перший крок

Блоки з відповідями — це приклад Extractive Summarization, описаного вище. Новий двофазний алгоритм може застосовуватися для книг, відкритих баз даних, а також будь-яких публічних веб-сторінок.

У дослідженні в якості пошукових запитів використовувалися теми з Wikipedia, а в якості джерела» витягуваних зведень » — результати пошуку Google. Алгоритм потім перефразував цей вміст для створення абсолютно нових статей. Алгоритм також проводив паралельний тест, генеруючи другий набір статей, використовуючи тільки посилання, згадувані Wikipedia.

Результати експерименту

Підводячи підсумки, дослідники відзначають, що експеримент був успішним. Google може створювати свій власний контент шляхом узагальнення вмісту веб-сторінок, тим самим відповідаючи на запитання користувача і не перенаправляючи його на інші сайти.

Коли Google почне застосовувати цей алгоритм, поки не уточнюється.

&Nbsp;

Загрузка ...
PriceMedia