Windows Developer

Giới thiệu Windows ML: Tương lai của phát triển học máy trên Windows Microsoft Build


Học máy luôn đi đầu trong đổi mới công nghệ, cho phép trải nghiệm người dùng biến đổi. Với những tiến bộ trong khách hàng silicon và thu nhỏ mô hình, các kịch bản mới là khả thi để chạy hoàn toàn cục bộ.

Để hỗ trợ các nhà phát triển vận chuyển trải nghiệm sản xuất trong bối cảnh AI ngày càng phức tạp, chúng tôi rất vui mừng được công bố bản xem trước công khai của Windows ML -Một thời gian chạy tiên tiến được tối ưu hóa cho suy luận mô hình trên thiết bị hiệu suất và triển khai đơn giản hóa và nền tảng của Windows AI Foundry.

Windows ML được thiết kế để hỗ trợ các nhà phát triển tạo ra các ứng dụng truyền AI dễ dàng, khai thác sức mạnh đáng kinh ngạc của hệ sinh thái phần cứng đa dạng của Windows cho dù đó là máy tính xách tay cấp nhập cảnh, Copilot+ PC hoặc máy trạm AI hàng đầu. Nó được xây dựng để giúp các nhà phát triển tận dụng Silicon của khách hàng phù hợp nhất với khối lượng công việc cụ thể của họ trên bất kỳ thiết bị nào-cho dù đó là NPU cho suy luận năng lượng thấp và duy trì, GPU cho mã lực thô hoặc CPU cho dấu chân và tính linh hoạt rộng nhất.

Windows ML cung cấp một khung thống nhất để các nhà phát triển có thể tự tin nhắm mục tiêu vào các PC Windows 11 có sẵn ngày hôm nay. Nó được xây dựng từ đầu để tối ưu hóa hiệu suất và sự nhanh nhẹn của mô hình và để đáp ứng tốc độ đổi mới trong các kiến ​​trúc, vận hành và tối ưu hóa mô hình trên tất cả các lớp của ngăn xếp. Windows ML là một sự phát triển của DirectML (DML) dựa trên sự học hỏi của chúng tôi từ năm qua, lắng nghe phản hồi từ nhiều nhà phát triển, đối tác Silicon của chúng tôi và các nhóm của chúng tôi phát triển trải nghiệm AI cho Copilot+ PCS. Windows ML được thiết kế với phản hồi này trong tâm trí, trao quyền cho các đối tác của chúng tôi – AMD, Intel, Nvidia, Qualcomm – để tận dụng hợp đồng nhà cung cấp thực thi để tối ưu hóa hiệu suất mô hình và phù hợp với tốc độ đổi mới.

Windows ML được cung cấp bởi Onnx Runtime Engine (ORT), cho phép các nhà phát triển sử dụng API ORT quen thuộc và ONNX là định dạng mô hình gốc, nó đảm bảo tích hợp liền mạch với các mô hình và dòng công việc hiện có. Một khía cạnh thiết kế chính là tận dụng và tăng cường hợp đồng Nhà cung cấp thực thi ORT (EP) hiện có để tối ưu hóa khối lượng công việc cho khách hàng khác nhau Silicon. Được xây dựng với sự hợp tác với các nhà cung cấp phần cứng độc lập (IHV) của chúng tôi, các nhà cung cấp thực hiện này được thiết kế để tối ưu hóa việc thực hiện mô hình trên các bộ xử lý AI hiện tại và mới nổi, cho phép mỗi nhà để thể hiện khả năng hoàn toàn nhất của họ. Chúng tôi đã hợp tác chặt chẽ với AMD, Intel, Nvidia và Qualcomm để tích hợp EPS của họ một cách liền mạch trong Windows ML và rất vui được hỗ trợ toàn bộ CPU, GPU và NPU từ ngày đầu tiên.

AMD Hỗ trợ đầy đủ Windows ML cho các sản phẩm Ryzen AI, trong đó nhà cung cấp thực hiện AMD GPU và AMD NPU của họ cho phép tận dụng tối đa GPU và NPU trong nền tảng của họ. Tìm hiểu thêm.

Các Windows ML tích hợp liền mạch trên CPU, GPU và NPU trong danh mục đầu tư của AMD bao gồm Ryzen AI 300 Series, trao quyền cho ISV để mang lại trải nghiệm AI đột phá. Sự hợp tác sâu sắc này giữa Microsoft và AMD đang thúc đẩy tương lai của AI trên Windows, tối ưu hóa hiệu suất, hiệu quả và tăng cường đổi mới. John Rayfield, phó chủ tịch của AI, AMD

Intel Tích hợp hiệu suất và hiệu quả của OpenVino trên CPU, GPU và NPU với sự đơn giản phát triển và triển khai được cung cấp bởi Windows ML, cho phép các nhà phát triển AI dễ dàng nhắm mục tiêu XPU phù hợp nhất với khối lượng công việc của họ trên quy mô rộng của các sản phẩm được cung cấp bởi bộ xử lý Intel Core. Tìm hiểu thêm.

Quan hệ đối tác của Intel với Microsoft trên Windows ML SuperChopges AI Develop ở khắp mọi nơi. ” Sudhir Tonse Udupa, Phó Chủ tịch, Kỹ thuật phần mềm AI PC, Intel

Nvidia’s Tensorrt EP mới là cách nhanh nhất để thực hiện các mô hình AI trên GPU NVIDIA RTX cho hơn 100 triệu máy tính RTX AI. Khi so sánh với việc triển khai ML trực tiếp trước đây, Tensorrt cho RTX cung cấp hiệu suất nhanh hơn 2x cho khối lượng công việc của AI. Tìm hiểu thêm.

Ngày nay, các nhà phát triển Windows thường phải chọn giữa khả năng tương thích phần cứng rộng và hiệu suất đầy đủ cho khối lượng công việc của AI. Thông qua Windows ML, các nhà phát triển có thể dễ dàng hỗ trợ một loạt phần cứng trong khi đạt được khả năng tăng tốc đầy đủ trên NVIDIA GEFORCE RTX và RTX Pro GPU. Jason Paul, phó chủ tịch của AI tiêu dùng, Nvidia

Qualcomm Technologies Inc. và Microsoft đã hợp tác để phát triển và tối ưu hóa các mô hình và ứng dụng AI dựa trên Windows ML cho NPU được tìm thấy trong bộ xử lý Snapdragon X Series bằng cách sử dụng Nhà cung cấp thực thi Mạng thần kinh Qualcomm (QNN EP). Tìm hiểu thêm.

Thời gian chạy tiên tiến của Windows ML mới không chỉ tối ưu hóa suy luận mô hình trên thiết bị mà còn đơn giản hóa việc triển khai, giúp các nhà phát triển dễ dàng khai thác toàn bộ tiềm năng của bộ xử lý AI nâng cao trong SnapdragonXNền tảng loạt. Khung hợp nhất của Windows ML và hỗ trợ cho phần cứng khác nhau, bao gồm NPU, GPU và CPU của chúng tôi, đảm bảo rằng các nhà phát triển có thể tạo các ứng dụng AI mang lại hiệu suất và hiệu quả đặc biệt trên một loạt các thiết bị. Chúng tôi mong muốn tiếp tục hợp tác với Microsoft để thúc đẩy sự đổi mới và vận tốc phát triển để mang lại trải nghiệm AI tốt nhất trên các nền tảng Windows Copilot+.Upendra Kulkarni, VP, Quản lý sản phẩm, Qualcomm Technologies, Inc.

Có một vài khía cạnh chính cần làm nổi bật cho Windows ML:

  • Triển khai đơn giản hóa: Tận dụng các API cơ sở hạ tầng của chúng tôi, các nhà phát triển không còn cần tạo ra nhiều bản dựng của ứng dụng của họ để nhắm mục tiêu silicon khác nhau vì họ không phải trực tiếp kết hợp các nhà cung cấp ONNX hoặc thực thi trong ứng dụng của họ. Chúng tôi sẽ cung cấp chúng trên thiết bị và cung cấp các cách đơn giản để đăng ký chúng và cho phép biên dịch mô hình trước thời gian (AOT).
  • Nhắm mục tiêu silicon nâng cao: Tận dụng các chính sách của thiết bị để tối ưu hóa cho công suất thấp, hiệu suất cao hoặc ghi đè để chỉ định chính xác những gì silicon để tận dụng cho một mô hình cụ thể. Trong tương lai, điều này sẽ cho phép xử lý chia cho hiệu suất tối ưu – tận dụng CPU hoặc GPU cho một số phần của mô hình và NPU cho những người khác.
  • Hiệu suất: Windows ML được thiết kế để thực hiện; Được xây dựng trên nền tảng của thời gian chạy ONNX và ONNX, chúng tôi thấy cải thiện tới 20% so với các định dạng mô hình khác. Theo thời gian, chúng tôi sẽ thêm nhiều khả năng dành riêng cho Windows để tối ưu hóa hơn nữa, như ánh xạ bộ nhớ tiến bộ, ghim mô hình một phần và bộ lập lịch được tối ưu hóa để thực hiện song song.
  • Khả năng tương thích: Làm việc với các đối tác IHV của chúng tôi, Windows ML sẽ đảm bảo sự phù hợp và khả năng tương thích, vì vậy bạn có thể dựa vào sự cải thiện liên tục trong khi đảm bảo xây dựng chính xác cho các mô hình của mình.

Nhưng đó không chỉ là về thời gian chạy, chúng tôi còn giới thiệu một bộ công cụ mạnh mẽ trong bộ công cụ AI cho mã VS (Bộ công cụ AI) để hỗ trợ mô hình và chuẩn bị ứng dụng-chuyển đổi sang ONNX từ Pytorch, Lượng tử hóa, Tối ưu hóa, Biên dịch và Hồ sơ, để giúp các nhà phát triển vận chuyển các ứng dụng sản xuất với các mô hình mở hoặc nguồn mở. Các công cụ này được thiết kế đặc biệt để đơn giản hóa quá trình chuẩn bị và vận chuyển các mô hình biểu diễn thông qua Windows ML mà không phải tạo ra nhiều bản dựng và logic phức tạp.

Hình ảnh hoạt hình của giao diện người dùng Windows ML

Windows ML có sẵn trong bản xem trước công khai bắt đầu từ hôm nay trên tất cả các máy Windows 11 trên toàn thế giới, cung cấp cho các nhà phát triển cơ hội khám phá khả năng của nó và cung cấp phản hồi. Bản xem trước bao gồm hai lớp API:

  • Lớp ML: API cấp cao để khởi tạo thời gian chạy, quản lý phụ thuộc và API trợ giúp để thiết lập các vòng AI tổng quát.
  • Lớp thời gian chạy: Các API thời gian chạy ONNX cấp thấp để kiểm soát chi tiết suy luận trên thiết bị.

Để bắt đầu, hãy cài đặt Bộ công cụ AI, tận dụng một trong các mẫu chuyển đổi và tối ưu hóa của chúng tôi hoặc bắt đầu xây dựng của riêng bạn. Khám phá các mẫu tài liệu và mã có sẵn trên Microsoft learn, hãy xem AI Dev Gallery (Cài đặt, Tài liệu) cho các bản demo và nhiều mẫu hơn để giúp bạn bắt đầu với Windows ML.

Logo của các công ty dưới một biểu ngữ đọc Windows ML.

Mặc dù xây dựng Windows ML, điều quan trọng đối với chúng tôi là nhận được phản hồi và quan điểm từ các nhà phát triển ứng dụng, đặc biệt là những người đi đầu trong việc cung cấp các tính năng và trải nghiệm do AI cung cấp. Chúng tôi đã chia sẻ các bản xem trước sớm của Windows ML với một vài nhà phát triển hàng đầu đang thử nghiệm tích hợp với Windows ML và chúng tôi rất vui mừng bởi các phản ứng ban đầu của họ:

Adobe (Volker Rölke – Nhà khoa học máy tính ML cao cấp): Các hiệu ứng của Adobe Premiere Pro và After Effects tung hứng các cảnh quay và khối lượng công việc ML nặng. Một API Windows ML đáng tin cậy mang lại hiệu suất nhất quán trên các thiết bị không đồng nhất sẽ loại bỏ các chướng ngại vật lớn và cho chúng tôi vận chuyển các tính năng đặc biệt hơn.

Bộ đệm (Tiến sĩ Ran Dubin, CTO, Bufferzone): Tại Bufferzone, chúng tôi tin rằng các PC được cung cấp năng lượng AI đại diện cho tương lai của các điểm cuối.

Filmora (Luyan Zhang – Quản lý sản phẩm AI): Sự đơn giản làm tôi ngạc nhiên. Theo cách tiếp cận dễ dàng hơn của Microsoft với các mô hình ONNX được thêm vào ứng dụng của chúng tôi. Chúng tôi đã chuyển đổi một tính năng AI phức tạp thành Windows ML chỉ trong 3 ngày.

McAfee (Carl Woodward, Kỹ sư chính của Sr.): Chúng tôi rất vui mừng về hiệu quả của Windows ML có thể mang lại sự phát triển và quản lý các khả năng phát hiện lừa đảo mới trong McAfee+.Windows ML sẽ cho phép chúng tôi tập trung vào các khu vực có tác động cao như độ chính xác và hiệu suất của mô hình, đồng thời cung cấp sự tự tin rằng các thành phần AI hoạt động tốt trên toàn bộ hệ sinh thái, bao gồm các bản sửa đổi phần cứng mới.

Bột (Barthélémy Kiss-đồng sáng lập và CEO tại Powder): Bột là một người sử dụng Windows ML sớm và nó đã cho phép chúng tôi tích hợp các mô hình nhanh hơn 3 lần, biến tốc độ thành một lợi thế chiến lược quan trọng. Với Windows 11 xử lý các nhà cung cấp silicon, bây giờ chúng tôi có thể tập trung nhiều hơn vào những gì các nhà phát triển bột của chúng tôi làm tốt nhất Phát triển nhiều trải nghiệm video AI kỳ diệu hơn trong thời gian ngắn hơn và với chi phí vận hành thấp hơn đáng kể.

Tái sinh (Aidan Fitzpatrick – Giám đốc điều hành): Chúng tôi cam kết hỗ trợ và tận dụng tối đa các chipset phần cứng AI mới vào ngày đầu tiên. Và Windows ML nên là một công cụ mạnh mẽ để giúp chúng tôi di chuyển với tốc độ đổi mới silicon. Đối với chúng tôi, Chén Thánh có thể thực hiện một mô hình chính xác cao và nó chỉ hoạt động trên các cửa sổ.

Phòng thí nghiệm Topaz(Tiến sĩ Suraj Raghuraman – Trưởng phòng AI):“Windows ML sẽ giảm kích thước trình cài đặt của chúng tôi rất nhiều, đi xuống từ gigabyte đếnmegabyte.Điều này sẽ cho phép người dùng của chúng tôi làm nhiều việc hơn trên đĩa của họ, bởi vì Lưu trữ mô hình Yêu cầu cũng đi xuống. Vì windows ml phụ thuộc rất nhiều vào thời gian chạy onnx,Nó thực sự dễ dàng cho chúng tôi để tích hợp nó. Chúng tôi đã tích hợp toàn bộ APITrong một vài ngày và đó là một trải nghiệm liền mạch từ quan điểm đổi mới.

Cho dù bạn là nhà phát triển AI dày dạn hoặc lần đầu tiên khám phá ML, Windows ML trao quyền cho bạn tập trung vào đổi mới thay vì quản lý cơ sở hạ tầng, cho phép bạn làm hài lòng khách hàng của mình với các ứng dụng truyền AI với dấu chân ứng dụng giảm. Windows ML thường sẽ có sẵn vào cuối năm nay. Trong khi đó, chúng tôi mong muốn phản hồi của bạn và xem cách bạn tận dụng Windows ML để tạo các giải pháp xác định lại khả năng. Tham gia Hành trình Windows ML ngay hôm nay và là một phần của làn sóng đổi mới AI tiếp theo!