Meta giới thiệu mô hình ngôn ngữ Llama 3: model AI mạnh nhất hiện tại
Mô hình ngôn ngữ lớn mới nhất của Meta là Llama 3 chính thức ra mắt với 2 model khác nhau: 8 tỷ tham số và 70 tỷ tham số, Llama 3 được Meta cải thiện khả năng suy luận và hiệu suất tổng thể, tốt hơn Llama 2 nhiều lần và cả khi so sánh với một số LLM khác trên thang đo điểm chuẩn mới. Meta cho biết Llama 3 sẽ sớm được triển khai và sẽ sử dụng ít tài nguyên hơn Llama 2, mặc dù có nhiều tham số hơn.
Llama 3 được đào tạo dựa trên hơn 15 nghìn tỷ token từ nguồn dữ liệu công cộng, với bộ lọc dữ liệu chất lượng cao và một tập hợp dữ liệu đa ngôn ngữ. Mô hình được tối ưu hóa cho các tình huống thực tế thông qua bộ điểm chuẩn mới.
Trong bài kiểm tra điểm chuẩn (benchmark) được thực hiện bởi Meta, Llama 3 Instruct với 8 tỷ tham số (8B) vượt trội hơn so với Mistral 7B và Gemma 7B, còn Llama 3 70B thì vượt trội so với Gemini 1.5 Pro và Claude 3 Sonnet. Đáng chú ý với bài test HumanEval (Human Evaluation) là các bài test đánh giá về “tính người” của các model thì Llama 3 cũng vượt trội so với Claude Sonnet, Mistral Medium và GPT-3.5. Ngoài hai phiên bản hiện tại, Meta vẫn còn một phiên bản Llama 3 nữa với 400 tỷ tham số và phiên bản này vẫn chưa được mở mã nguồn vì vẫn đang trong quá trình huấn luyện.
Ngoài hai phiên bản hiện tại, Meta vẫn còn một phiên bản Llama 3 nữa với 400 tỷ tham số và phiên bản này vẫn chưa được mở mã nguồn và vẫn đang trong quá trình training.
Một điểm đáng chú ý nữa trên Llama 3 đó là nó đã giảm bớt đi việc từ chối trả lời các mẫu prompt mang tính chất nhạy cảm, ví dụ khi hỏi nó cách làm sao để chia tay với một ai đó, hoặc là giảm thiểu đi việc từ chối các từ khoá nhạy cảm, đặt nó đúng vào bối cảnh của người hỏi.
Hiện tại Llama 3 đang là mô hình ngôn ngữ dựa trên văn bản thuần tuý, nhưng vì mang tính mở, Meta mong muốn xây dựng Llama 3 trở thành mô hình ngôn ngữ đa phương thức (multimodal) và đa ngôn ngữ (multilingual).
Llama 3 còn tích hợp các công cụ an toàn và bảo mật mới, bao gồm Llama Guard 2 và Cybersec Eval 2, cùng với Code Shield để lọc mã không an toàn. Meta cũng phát triển torchtune, thư viện PyTorch-native, để hỗ trợ việc tạo và tinh chỉnh mô hình LLM một cách dễ dàng. Llama 3 không chỉ là một bước tiến trong lĩnh vực AI của Meta mà còn là một nền tảng mở cho cộng đồng phát triển và triển khai các ứng dụng AI một cách có trách nhiệm. Đây là một phần trong cam kết lâu dài của Meta về việc phát triển một hệ sinh thái AI mở và an toàn.
Ngay bây giờ nếu trải nghiệm thử Meta Llama 3 thì có thể tham khảo tại đây, hoặc có một cách khác là bạn sử dụng LM Studio để tải model về trên Hugging Face.
Cuộc đua về các model AI chưa bao giờ hết nóng, Llama 3 có thể là model AI mạnh nhất hiện tại nhưng 1 tháng, 2 tháng hay 3 tháng nữa thì chưa biết, khi mà GPT-5 đang được đồn đoán sắp ra mắt, Gemini 1.5 Ultra cũng đang chuẩn bị trình làng, chưa kể đến Sora AI cũng của OpenAI đang khiến cả thế giới bất ngờ. Nhưng Mark Zuckerberg cũng đã cho biết, Meta đã bắt đầu “suy nghĩ đến Llama 4 và Llama 5 rồi”.