Amazon перенесла работу Alexa на собственную аппаратную платформу, отказавшись от чипов NVIDIA

13.11.2020 - Просмотров: 42

Интернет-компания Amazon.Com объявила в четверг, что переносит некоторые из своих вычислительных операций, поддерживающих работу голосового ассистента Alexa, на собственные пользовательские чипы, исключая чипы NVIDIA. Ожидается, что это ускорит работу сервиса Alexa и одновременно снизит расходы Amazon.

Когда пользователи таких устройств, как интеллектуальные колонки семейства Amazon Echo, например, задают вопрос голосовому помощнику, запрос отправляется в один из центров обработки данных Amazon для его обработки и генерации ответа. При этом будет дан ответ в текстовом формате, а затем необходимо перевести его в слышимую речь, которую будет произносить голосовой ассистент.

Раньше все эти операции выполнялись с помощью чипов NVIDIA, а теперь, по словам Amazon"большая часть" этого процесса будет выполняться с использованием собственного чипа Inferentia. Чип Amazon, впервые анонсированный в 2018 году, специально разработан для ускорения выполнения крупномасштабных задач машинного обучения, таких как преобразование текста в речь или распознавание изображений.

Владельцы облачных вычислительных сервисов, таких как Amazon, Microsoft и Google, стали одним из крупнейших потребителей чипов вычислительного ИИ для своих дата-центров, что привело к буму продаж специализированных решений Intel, NVIDIA и других. Но крупные технологические компании все чаще отказываются от традиционных поставщиков полупроводников для разработки собственных процессоров. Компания Apple, объявившая о выпуске первых компьютеров Mac с собственным процессором M1 с архитектурой Arm, также может перейти в ту же линейку, отказавшись от услуг Intel.

Amazon сообщила, что переход на чип Infertia для некоторых операций обработки запросов Alexa позволил сократить задержку на 25% при одновременном снижении затрат на 30%.

Компания также объявила о том, что ее облачный сервис распознавания лиц Rekognition также приступил к внедрению чипов Inferentia. Однако при этом не было указано, какие чипы ранее использовались сервисом распознавания лиц, а также какая часть операций была перенесена на собственные чипы.

Читайте также