Сегодня практически невозможно избежать взаимодействия с технологиями, использующими генеративный искусственный интеллект (ИИ), однако в продуктах Apple его пока заметно меньше. Причём это не всегда является осознанным выбором компании.
Производитель iPhone несколько раз откладывал запуск улучшенной версии голосового помощника Siri с функциями ИИ, изначально обещанной в 2024 году. Тем не менее, соглашение с Google позволит объединить культовый ассистент с моделью Gemini уже в этом году. В преддверии Всемирной конференции разработчиков (WWDC) Apple активно работает над внедрением мощных возможностей ИИ в относительно скромную вычислительную среду смартфона. Однако, по мнению обозревателей, результат может не прийтись по вкусу фанатам Apple.
Apple долгое время подчеркивала преимущества обработки ИИ-задач непосредственно на устройстве для обеспечения конфиденциальности пользовательских данных. Однако новый отчёт издания The Information предполагает, что, несмотря на все усилия Apple, обновленная Siri с технологиями Gemini будет в значительной степени опираться на облачные ресурсы Google и Nvidia. В публикации утверждается, что Siri, оснащенная Gemini, будет функционировать как на самом устройстве, так и в облаке, что является явным отступлением от прежнего предпочтения локального ИИ.
С каждым анонсом новых чипов производители, включая Apple с её акцентом на улучшениях Neural Engine, заявляют об их оптимизации для ИИ. Можно подумать, что современные смартфоны уже готовы обрабатывать сложные модели ИИ, но это не совсем так. Фактически, графические процессоры (GPU) большинства телефонов могут обрабатывать больше "токенов" ИИ — единиц информации, используемых ИИ-моделями — чем специализированные нейронные процессоры (NPU). Такие компоненты, как Neural Engine от Apple, предназначены для контекстной и эффективной, но не для масштабной обработки ИИ. Даже если бы телефоны имели более быструю обработку ИИ, им зачастую не хватает оперативной памяти (RAM) для хранения огромных моделей в памяти.
Даже самые крупные облачные ИИ-модели пока остаются лишь "средними" помощниками, что делает внедрение мощного ИИ на устройстве крайне сложной задачей. Модели ИИ, работающие на смартфонах, физически меньше и содержат максимум несколько миллиардов "параметров" — внутренних настроек, определяющих их поведение. Для сравнения, новейшие модели Gemini от Google, по данным The Information, обладают триллионами параметров. Кроме того, локальные ИИ-модели часто "квантуются", то есть упрощаются для работы с меньшей точностью, что ускоряет их, но может снижать точность генерации токенов. Всё это приводит к тому, что локальные ИИ воспринимаются как менее "умные" по сравнению с их облачными аналогами, причём даже крупные облачные модели иногда демонстрируют ограниченные возможности.
Google разработала версии Gemini, оптимизированные для мобильных устройств, известные как Gemini Nano. Однако эти версии предназначены для обеспечения контекстных функций, таких как Magic Compose (функция, предлагающая варианты ответов в сообщениях) или суммаризация аудио. Siri же позиционируется как полноценный разговорный помощник, с которым пользователь может общаться и давать команды. Это требует совершенно другого опыта и, соответственно, иной модели ИИ. На устройствах Android Google даже не пытается запускать разговорный Gemini локально: любое взаимодействие с ним всегда напрямую передаётся в облако.