Kế hoạch "đại phẫu" Siri để Apple tìm lại lợi thế cạnh tranh công nghệ AI

Thật ra kế hoạch nâng cấp toàn diện Siri, trợ lý ảo trong những thiết bị công nghệ của Apple đã được các lãnh đạo cấp cao của Apple đưa ra từ đầu năm 2023. Quyết định này được xác định, sau khi phó chủ tịch mảng phát triển phần mềm, và quản lý phát triển mảng machine learning của Apple, Craig Federighi và John Giannandrea bỏ ra vài tuần sử dụng chatbot mới ra mắt khi ấy của OpenAI, ChatGPT.

Việc ChatGPT ứng dụng AI tạo sinh, có thể làm thơ, có thể viết code lập trình rồi trả lời cả những câu hỏi phức tạp của người dùng bỗng nhiên biến Siri trở thành “đồ cổ”. Đó là tuyên bố của hai nguồn tin giấu tên của tờ NYT.

Ra mắt năm 2011 dưới dạng trợ lý ảo tích hợp trong iPhone, Siri trong 13 năm qua đều bị giới hạn ở việc chỉ xử lý được những lệnh yêu cầu đơn lẻ của người dùng, chưa từng có khả năng trò chuyện với người dùng như chatbot AI của năm 2022. Khá thường xuyên, Siri xảy ra tình trạng không hiểu rõ câu hỏi và yêu cầu của người dùng. Còn trong khi đó, ChatGPT hiểu rõ những câu hỏi theo sau, chẳng hạn như “thời tiết San Francisco thế nào?” rồi sau đó là “thế còn New York thì sao?”

Khi ấy, việc các vị lãnh đạo Apple nhận ra công nghệ mới đã vượt rất xa khả năng của Siri đã khởi động một chuỗi phản ứng mô tả sự tái cơ cấu lớn nhất của Apple trong vòng hơn 1 thập kỷ qua. Nỗ lực và quyết tâm bắt kịp tốc độ phát triển của ngành nghiên cứu và vận hành dịch vụ AI, Apple đã biến những dự án nghiên cứu AI của các kỹ sư trong tập đoàn trở thành mục tiêu quan trọng hàng đầu. Những dự án này được họ gọi bằng khái niệm “tent pole project”.

Dự kiến, ngày 10/6 tới, tại WWDC 2024, Apple sẽ công bố những tính năng AI mới trên iPhone và iPad, trong đó có cả Siri phiên bản mới, thông minh và đa dụng hơn, theo ba nguồn tin nội bộ Apple. Để làm được điều này, iPhone 16 ra mắt tháng 9 này cũng sẽ có dung lượng RAM lớn hơn để tải mô hình LLM vào bộ nhớ hỗ trợ cho chip xử lý vận hành. Cùng lúc, Apple cũng đã có những trao đổi và bàn thảo việc mua bản quyền vài mô hình AI để vận hành chatbot trên máy chủ đám mây, với Google, OpenAI và Cohere.

Google thì lo ngại vị thế thống trị tìm kiếm và quảng cáo trực tuyến bị AI đe dọa. Apple cũng vậy, họ lo ngại công nghệ AI mới sẽ đe dọa vị thế thống trị thị trường smartphone toàn cầu. AI, trong mắt Apple, có khả năng tạo ra những hệ điều hành di động thực sự đe dọa được tới vị thế của iOS hiện tại. Đó là tuyên bố của hai nguồn tin nội bộ, mô tả cách suy nghĩ của các giám đốc cấp cao Apple.

Theo những vị giám đốc này, công nghệ trí thông minh nhân tạo hoàn toàn có thể tạo ra cả một hệ sinh thái ứng dụng AI, tự động đặt chuyến xe, đặt đồ ăn hay quản lý lịch của người dùng. Như vậy thì chẳng ai còn cần dùng tới App Store để tải những ứng dụng mới về nữa. Hệ sinh thái ứng dụng của hệ điều hành iOS hay iPadOS, thứ đem về khoản doanh thu trị giá 24 tỷ USD mỗi năm cũng sẽ lại bị đe dọa.

Nỗi lo kế tiếp của Apple là việc nếu họ không có hệ thống AI riêng tự phát triển, iPhone dần dần sẽ trở nên “dumb” hơn những đối thủ cạnh tranh. Hiện giờ cũng không rõ có bao nhiêu người sử dụng Siri hàng ngày, nhưng AI có thể ảnh hưởng tới thị phần smartphone của riêng Apple, chiếm 85% tổng thị phần lợi nhuận smartphone toàn cầu, giá trị doanh thu hàng năm lên tới 200 triệu USD.

Sự gấp gáp mà các vị giám đốc của Apple cảm nhận được đã khiến tập đoàn dừng vài canh bạc lớn khác, bao gồm cả dự án Titan phát triển ô tô điện và thuật toán xe tự hành, dự án đã ngốn của Apple cỡ 10 tỷ USD. Hàng trăm kỹ sư được chuyển về nhóm phát triển AI tiêu dùng.

Cùng lúc, Apple cũng nghiên cứu việc tự phát triển những máy chủ vận hành bằng chip Apple Silicon. Điều này có thể giúp Apple tiết kiệm chi phí, tạo ra giải pháp và công cụ vận hành mô hình AI đồng nhất giữa cả thiết bị đầu cuối lẫn máy chủ đám mây.

Thay vì cạnh tranh trực tiếp với ChatGPT bằng một chatbot biết làm thơ hay lập trình, Apple đang tập trung làm ra một phiên bản Siri thông minh hơn trong việc xử lý những nhiệm vụ người dùng giao cho nó. Siri với mô hình AI cũng sẽ có thể tóm tắt tin nhắn.

Và giống hệt như những lần marketing trước, Apple sẽ tập trung quảng bá tính riêng tư và bảo mật của công cụ Siri mới, vì nó sẽ xử lý lệnh và yêu cầu của người dùng ngay trên phần cứng iPhone thay vì gửi thông tin về data center. Chiến lược này cũng sẽ tiết kiệm cho Apple. OpenAI hiện tại vận hành LLM với chi phí khoảng 12 cent USD cho mỗi 1000 token văn bản mà ChatGPT tạo ra, đây là chi phí máy chủ đám mây vận hành.

Tuy nhiên nguy cơ của Apple phải đối mặt, là những giải pháp AI vận hành local như mô hình dùng để vận hành Siri phiên bản mới sẽ có hiệu năng và sức mạnh tạo sinh kém hơn những LLM hàng trăm tỷ tham số vận hành trên máy chủ đám mây. Những nghiên cứu trước đây đã chứng minh rằng, mô hình AI nhỏ có khả năng tạo ra lỗi cao hơn, những lỗi gọi là “hallucination”, mô hình AI bị loạn, tự bịa ra thông tin không chính xác.

Tom Gruber, một trong những người sáng lập nhóm nghiên cứu phát triển Siri, làm việc cho Apple từ 2010 đến 2018 cho biết:

“Tầm nhìn ngay từ ban đầu của Siri là tạo ra một giao diện cho phép công cụ trợ lý ảo có thể trò chuyện với người dùng, hiểu cả ngôn ngữ lẫn ngữ cảnh câu hỏi, nhưng đó là một vấn đề lớn. Giờ công nghệ đã thay đổi, đã có khả năng tạo ra một Siri làm việc tốt hơn trước. Miễn là Apple không cố gắng tạo ra một công cụ nhỏ nhưng cố trả lời và làm được mọi thứ, thì tôi nghĩ Apple sẽ không gặp rắc rối gì.”

Trong cuộc chạy đua AI, Apple có vài lợi thế, bao gồm hơn 2 tỷ thiết bị công nghệ trên toàn thế giới, nền tảng để họ mang những sản phẩm AI tới cho mọi người. Cùng lúc họ cũng có một nhóm kỹ sư phát triển bán dẫn hàng đầu thế giới, đủ khả năng phát triển những con chip xử lý đủ hiệu năng vận hành những tác vụ AI.

Nhưng trong vòng 10 năm qua, Apple cũng không tạo ra được một chiến lược phát triển và vận hành AI hợp lý. Siri cũng chỉ có những nâng cấp nhỏ kể từ khi ra mắt năm 2011. Công cụ trợ lý ảo này gặp khó khăn trong việc tiếp cận cộng đồng sử dụng thiết bị công nghệ, nhất là trong mảng thiết bị smarthome. Trong những chiếc HomePod, Siri còn chẳng làm được một nhiệm vụ đơn giản là chơi nhạc theo yêu cầu từ giọng nói của người dùng.

John Burkey, người đã làm việc với dự án Siri trong vòng 2 năm trước khi rời Apple cho rằng, nhóm kỹ sư phát triển Siri đã thất bại trong việc lôi kéo sự chú ý, và cả nguồn lực tài chính để phát triển giải pháp.

Khó khăn nữa của Apple chính là tuyển dụng và giữ chân những nhà nghiên cứu AI hàng đầu. Trong những năm qua, họ đã mua lại trên dưới hai chục startup AI lớn đến nhỏ, dẫn đầu bởi những nhà nghiên cứu trí thông minh nhân tạo xuất sắc. Nhưng những nhà quản lý và nhà nghiên cứu này không ở lại Apple lâu. Trước đây từng có một bài viết về phòng nghiên cứu AI của Apple tại Zurich, Thụy Sỹ, ở đó có một đoạn nói về giáo sư Ruslan Salakhutdinov. Ông có tuyên bố: “Những nhà nghiên cứu AI nói: Mình có những lựa chọn nào? Quay lại giảng dạy và nghiên cứu hàn lâm được không? Mình có được quay trở lại những viện nghiên cứu, nơi có thể làm việc thoải mái hơn một chút hay không?”

Chính bản thân giáo sư Salakhutdinov cũng rời bỏ Apple năm 2020 để trở về trường Carnegie Mellon tiếp tục nghiên cứu và giảng dạy.

Những tháng gần đây, Apple đã liên tục công bố những kết quả nghiên cứu hàn lâm những mô hình, giải pháp và công nghệ AI. Đi kèm với đó là những mô hình được công bố dưới dạng mã nguồn mở vận hành phi lợi nhuận. Nhưng những nhà nghiên cứu AI lâu năm đã đặt ra câu hỏi về giá trị của những nghiên cứu này. Theo các nhà nghiên cứu, Apple có vẻ đang quan tâm tới việc tạo ra cho công chúng cảm giác họ nghiêm túc với AI, chứ không phải thực sự tạo ra một ví dụ AI có thể được Apple thương mại hóa trong nay mai.

Tsu-Jui Fu, thực tập sinh Apple, nghiên cứu sinh tiến sĩ ngành AI ở đại học Santa Barbara, California là tác giả của một trong những báo cáo nghiên cứu AI của Apple gần đây. Mùa hè 2023, anh đã phát triển một hệ thống chỉnh sửa ảnh bằng lệnh văn bản thay vì những công cụ giống như Photoshop. Anh cho biết, Apple đã hỗ trợ dự án này bằng cách cung cấp tài nguyên GPU máy chủ đám mây để phục vụ nghiên cứu, nhưng hoàn toàn không có tương tác giữa Fu với nhóm kỹ sư phát triển AI của Apple.

Đây là thành quả nghiên cứu của Fu, có tên MGIE:

Dù đã phỏng vấn xin việc ở Adobe và Nvidia, nhưng Fu nói anh quyết định sẽ về Apple sau khi lấy bằng tiến sĩ, vì anh cho rằng bản thân mình có thể tạo ra khác biệt lớn tại đây:

“Sản phẩm và nghiên cứu AI có thể mới bùng nổ tại Apple, còn ở những tập đoàn công nghệ lớn khác quá trình nghiên cứu giải pháp AI đã tương đối hoàn thiện. Ở Apple, tôi có thể có không gian làm việc rộng hơn để dẫn đầu một dự án, thay vì chỉ là một nhân sự trong cả nhóm phát triển.”