Bởi Admin trong Tin tức — 01 Th05 2025

Mô hình AI Phi-4 mới nhất của Microsoft có hiệu suất ngang bằng với các hệ thống lớn hơn nhiều

Microsoft vừa công bố một loạt mô hình AI "mở" mới vào ngày 30/4/2025, trong đó mô hình có khả năng cao nhất đã chứng tỏ sức cạnh tranh với o3-mini của OpenAI trên ít nhất một tiêu chuẩn đánh giá.

$Hình ảnh nền xanh với logo Microsoft ở góc dưới trái và dòng chữ “Phi-4” ở trung tâm, đại diện cho mô hình AI mới của Microsoft.$

Phi-4 – mô hình ngôn ngữ nhỏ nhưng mạnh mẽ, vượt trội trong các bài toán toán học và lý luận.

Phi-4: Mô hình nhỏ với hiệu suất ấn tượng

Theo thông báo từ Microsoft, các mô hình mới bao gồm Phi-4-reasoning, Phi-4-reasoning-plus và Phi-4-mini-reasoning, đánh dấu một kỷ nguyên mới cho các mô hình ngôn ngữ nhỏ (SLM) và khả năng suy luận của chúng.

Phi-4-reasoning, một mô hình với 14 tỷ tham số, được huấn luyện bằng dữ liệu web "chất lượng cao" cùng với "các bài thị phạm được tuyển chọn" từ mô hình GPT-4o của OpenAI. Đặc biệt, mô hình này còn được huấn luyện trên khoảng 1 triệu bài toán tổng hợp được tạo ra bởi mô hình suy luận R1 của công ty khởi nghiệp AI Trung Quốc DeepSeek.

Microsoft cho biết Phi-4-reasoning-plus, phiên bản nâng cao hơn, đạt hiệu suất gần bằng với mô hình R1, một mô hình có số lượng tham số lớn hơn đáng kể (671 tỷ tham số). Điều này thể hiện rõ qua kết quả trên AIME 2025 (vòng loại năm 2025 cho Thế vận hội Toán học Hoa Kỳ).

Ứng dụng chuyên biệt

Microsoft nhấn mạnh rằng các mô hình Phi-4 mới đặc biệt phù hợp cho các ứng dụng toán học, khoa học và lập trình. Đối với Phi-4-reasoning-plus, đây là phiên bản của mô hình Phi-4 trước đó được điều chỉnh thành mô hình suy luận để cải thiện khả năng giải quyết vấn đề.

Các mô hình này được xây dựng dựa trên kiến trúc Phi-4 với những cải tiến có mục tiêu cụ thể về hành vi mô hình và chế độ đào tạo. Các quyết định phương pháp luận chính bao gồm Huấn luyện tinh chỉnh có giám sát có cấu trúc (SFT), với hơn 1,4 triệu lời nhắc được tuyển chọn tập trung vào các trường hợp "biên" - những vấn đề ở ranh giới khả năng cơ bản của Phi-4.

Đột phá trong hiệu quả mô hình

Điều đáng chú ý là Phi-4 vượt trội hơn các mô hình có kích thước tương đương và thậm chí lớn hơn trong lĩnh vực suy luận liên quan đến toán học. Điều này đạt được nhờ những tiến bộ trong toàn bộ quy trình, bao gồm việc sử dụng bộ dữ liệu tổng hợp chất lượng cao, tuyển chọn dữ liệu hữu cơ chất lượng cao và các đổi mới sau quá trình đào tạo.

Weizhu Chen, Phó Chủ tịch phụ trách AI tạo sinh tại Microsoft, cho biết: "Những mô hình này được thiết kế để trao quyền cho các nhà phát triển với khả năng AI tiên tiến."

Thách thức về năng lực AI

Trong cuộc gọi báo cáo thu nhập quý 3 tài khóa 2025 của Microsoft, CFO Amy Hood đã cho biết công ty có thể đối mặt với những hạn chế về năng lực AI sớm nhất là vào tháng 6. Điều này cho thấy nhu cầu ngày càng tăng đối với các dịch vụ AI của Microsoft, bao gồm cả các mô hình Phi mới.

Tương lai của AI đa phương thức

Microsoft cũng đang phát triển Phi-4-multimodal, một mô hình có khả năng xử lý cả hình ảnh và âm thanh cùng lúc. Theo Microsoft, "Tương lai của AI đa phương thức đã ở đây và sẵn sàng để chuyển đổi các ứng dụng của bạn."

Với khả năng gọi hàm, Phi-4-mini và Phi-4-multimodal có thể mở rộng khả năng xử lý văn bản bằng cách tích hợp các công cụ tìm kiếm, kết nối các công cụ khác nhau và nhiều tính năng khác.

Kết luận

Sự ra mắt của các mô hình Phi-4 mới đánh dấu một bước tiến quan trọng trong việc phát triển các mô hình AI nhỏ nhưng hiệu quả. Microsoft tiếp tục mở rộng ranh giới giữa kích thước và chất lượng, chứng minh rằng các mô hình nhỏ hơn có thể đạt được hiệu suất tương đương với các hệ thống lớn hơn nhiều lần khi được huấn luyện và tối ưu hóa đúng cách.

Với khả năng suy luận mạnh mẽ và hiệu quả cao, các mô hình Phi-4 mới của Microsoft hứa hẹn sẽ mang lại những ứng dụng AI tiên tiến cho các nhà phát triển và doanh nghiệp trong tương lai gần.