Loihi 2 cho Neuromorphic Computing

Chúng tôi đã liên tục theo dõi những nỗ lực về Neuromorphic của Intel kể từ khi hãng tung ra silicon 14nm chuyên dụng đầu tiên dành cho Neuromorphic Computing, được gọi là Loihi, vào đầu năm 2018. Trong một cuộc phỏng vấn với Giám đốc Phòng thí nghiệm Intel, Tiến sĩ Richard Uhlig vào tháng 3 năm 2021, tôi đã hỏi về sự phát triển của phần cứng và khi nào chúng ta có thể thấy thế hệ thứ hai. Hôm nay là ngày hôm đó, và nhóm sẽ công bố Loihi 2, một bản nâng cấp đáng kể so với thế hệ đầu tiên, giải quyết rất nhiều vấn đề còn tồn đọng từ thiết kế đầu tiên. Điều có lẽ thú vị không kém là nút quy trình được sử dụng: Intel đang thông báo rằng Loihi 2 đang được xây dựng, bằng silicon ngày nay, sử dụng phiên bản tiền sản xuất của nút quy trình EUV đầu tiên của Intel, Intel 4.

Máy tính cấu trúc thần kinh dành cho Intel

Bằng cách tạo ra một kiến ​​trúc mà cốt lõi của nó được mô phỏng giống như một bộ não, ý tưởng là việc có hàng triệu tế bào thần kinh và khớp thần kinh sẽ dẫn đến việc tính toán các nhiệm vụ với những lợi ích về sức mạnh / hiệu suất duy nhất trong các nhiệm vụ cụ thể mà bộ não được thiết kế để thực hiện. Đây là một sản phẩm thương mại tiềm năng lâu dài của Intel, tuy nhiên nhiệm vụ của nhóm là phát triển cả công nghệ và phần mềm để khám phá và tăng tốc các tác vụ phù hợp với tính toán kiểu nơ-ron.

Phòng thí nghiệm Neuromorphic tại Intel đã thực sự ra đời thương vụ mua lại Fulcrum Microsystems vào năm 2011. Vào thời điểm đó, nhóm Fulcrum là một nhóm máy tính không đồng bộ làm việc trên các thiết bị chuyển mạch mạng. Công nghệ đó đã được chuyển đến nhóm mạng bên trong Intel, và bộ phận nghiên cứu đã chuyển sự chú ý sang các ứng dụng khác của máy tính không đồng bộ, và đổ bộ vào Neuromorphic.

Vào thời điểm đó, nghiên cứu về loại kiến ​​trúc tính toán thần kinh hình học này cho khối lượng công việc thực tế còn khá sơ khai – trong khi lĩnh vực này đã xuất hiện từ cuối những năm 1980, thì phần cứng được xây dựng cho nghiên cứu chuyên dụng vẫn chưa thực sự tồn tại cho đến đầu những năm 2010. Dự án Não người, một dự án nghiên cứu kéo dài 10 năm do Liên minh Châu Âu tài trợ để xem xét lĩnh vực này, chỉ được thành lập vào năm 2013, và trong số đó là hệ thống SpiNNaker vào năm 2019, với một triệu chip, một tỷ tế bào thần kinh, cho 100 kW của công suất hoạt động.

Để so sánh, Loihi thế hệ đầu tiên của Intel hỗ trợ 131000 tế bào thần kinh trên 60 mm2 chip và 768 chip có thể được kết hợp với nhau trong một hệ thống Pohoiki Springs với 100 triệu tế bào thần kinh chỉ với 300 watt. Trong hoạt động tiếp thị của chính Intel, họ đã mô tả điều này tương đương với một con chuột đồng. Chip Loihi 2 mới, ở cấp độ cao, sử dụng 31 mm2 mỗi chip cho một triệu tế bào thần kinh, mật độ tăng gấp 15 lần một cách hiệu quả, tuy nhiên sự phát triển vượt ra ngoài con số thô.

Loihi 2

Chip Loihi 2 ở cấp độ cao có thể trông tương tự: 128 lõi thần kinh đa hình, nhưng giờ mỗi lõi có thêm 8x nơ-ron và khớp thần kinh. Mỗi trong số 128 lõi đó có 192 KB bộ nhớ linh hoạt, so với trước đây nơi nó được cố định trên mỗi lõi trong thời gian chạy và mỗi nơ-ron có thể được cấp phát tới 4096 trạng thái tùy thuộc vào mô hình, trong khi giới hạn trước đó chỉ là 24. Mô hình Neuron giờ đây cũng có thể được lập trình đầy đủ, tương tự như FPGA, cho phép linh hoạt hơn.

Theo truyền thống, các tế bào thần kinh và mạng tăng đột biến cung cấp dữ liệu trong một sự kiện nhị phân, đó là những gì Loihi v1 đã làm. Với Loihi 2, những sự kiện đó có thể được phân loại với trọng tải 32 bit, mang lại sự linh hoạt sâu hơn cho tính toán trên chip. Giờ đây, những sự kiện đó có thể được theo dõi trong thời gian thực với các tính năng phát triển / gỡ lỗi mới trên chip, thay vì tạm dừng / đọc / phát. Kết hợp, điều này cũng cho phép kiểm soát tốt hơn khi thay đổi động khối lượng công việc tính toán, chẳng hạn như nén quạt ra, chia tỷ lệ trọng lượng, tổng hợp và phát sóng.

Có lẽ một trong những cải tiến lớn nhất là khả năng kết nối. Thế hệ đầu tiên sử dụng giao thức không đồng bộ tùy chỉnh để tạo ra một mạng lưới nơ-ron 2D lớn, trong khi Loihi 2 có thể được định cấu hình để sử dụng nhiều giao thức khác nhau dựa trên nhu cầu, nhưng cũng có thể trong mạng 3D. Chúng tôi được biết rằng Loihi 2 không chỉ là một con chip đơn lẻ, mà nó sẽ là một họ chip có cùng kiến ​​trúc nơ-ron nhưng có nhiều tùy chọn kết nối khác nhau dựa trên các trường hợp sử dụng cụ thể. Điều này có thể được sử dụng kết hợp với các bộ tăng tốc nén tin nhắn tích hợp để tăng hiệu quả băng thông từ chip này sang chip khác lên 10 lần.

Điều này cũng mở rộng cho kết nối Loihi bên ngoài với máy tính thông thường hơn, vốn trước đây là trung gian của FPGA – giờ Loihi 2 hỗ trợ 10G Ethernet, GPIO và SPI. Điều này sẽ cho phép tích hợp dễ dàng hơn mà không cần hệ thống tùy chỉnh, chẳng hạn như tạo các cụm máy tính Loihi 2 được phân tách.

Được xây dựng trên Intel 4

Chúng tôi đã rất ngạc nhiên khi biết rằng Loihi 2 được xây dựng trên phiên bản tiền sản xuất của quy trình Intel 4. Chúng ta vẫn còn một khoảng thời gian nữa để Loihi 2 trở thành một phần doanh thu của Intel và nhóm Neuromorphic biết nhiều điều đó, nhưng hóa ra con chip này có lẽ là một ứng cử viên lý tưởng để giúp đưa ra một quy trình mới.

Với kích thước 31 mm2, có nghĩa là ngay cả khi năng suất cần cải thiện, một tấm wafer duy nhất có thể cung cấp nhiều chip hoạt động hơn so với thử nghiệm với kích thước khuôn lớn hơn. Khi nhóm thực hiện kiểm tra sau silicon đối với điện áp / tần số / chức năng, họ có thể chuyển về nhóm Phát triển Công nghệ của Intel nhanh hơn. Chúng tôi xác nhận rằng có silicon thực tế trong phòng thí nghiệm và trên thực tế, phần cứng sẽ có sẵn ngay hôm nay thông qua DevCloud của Intel, trực tiếp bằng kim loại, mà không cần bất kỳ mô phỏng nào.

Thông thường với các nút quy trình mới, bạn cần một khách hàng có kích thước khuôn silicon nhỏ để giúp lặp lại các rào cản tiềm năng trong việc đưa quy trình lên một đoạn đường nối và sản xuất quy mô đầy đủ. Các đối thủ cạnh tranh của xưởng đúc Intel thường làm điều này với những khách hàng có chip cỡ điện thoại thông minh và lợi ích dành cho khách hàng thường có ý nghĩa đầu tiên đối với phần cứng hoặc có lẽ là một số hình thức chiết khấu ban đầu (mặc dù, có lẽ không phải trong điều kiện ngày nay). Trước đây, Intel đã gặp khó khăn trên mặt trận đó, vì họ chỉ có silicon của riêng mình để sử dụng làm phương tiện thử nghiệm.

Nhóm Neuromorphic nói rằng nó thực sự rất phù hợp, vì phần cứng neuromorphic yêu cầu mật độ cao và công suất tĩnh thấp được cung cấp bởi các nút quy trình cạnh hàng đầu. Thiết kế 128 lõi cũng có nghĩa là nó có một bộ phận lặp lại nhất quán, cho phép nhóm quy trình xem xét tính thường xuyên và nhất quán trong sản xuất. Ngoài ra, do Loihi vẫn còn là một dự án nghiên cứu cho đến nay, không có kỳ vọng nghiêm túc nào để đưa sản phẩm đó ra thị trường trong một thời điểm nhất định, điều mà có lẽ một khách hàng lớn có thể cần.

Điều này có nghĩa là Intel’s 4 đã sẵn sàng để sản xuất? Không hoàn toàn, nhưng nó chỉ ra rằng tiến bộ đang được thực hiện. Một số điểm chuẩn được liệt kê của Loihi 2 đã báo trước về ‘kết quả phần cứng được mô phỏng dự kiến’, mặc dù một số điểm khác được thực hiện trên silicon thực và công ty cho biết ngày nay họ có silicon thực để triển khai trên đám mây. Intel 4 là nút quy trình đầu tiên của Intel sử dụng kỹ thuật in thạch bản Extreme Ultra Violet (EUV) và Intel sẽ là nhà sản xuất bán lớn cuối cùng bắt đầu quy trình EUV để sản xuất. Nhưng chúng ta vẫn còn một chặng đường – quay lại sự kiện Accelerated của Intel, EUV và Intel 4 không thực sự dự kiến ​​sẽ tăng sản lượng cho đến nửa cuối năm 2022.

Tóm lại, từ thông báo của Intel, chúng ta có thể xem xét mật độ bóng bán dẫn. Với 2,3 tỷ bóng bán dẫn trong 31 mm2, điều đó sẽ đặt mật độ ở mức 71,2 triệu mỗi mm2, chỉ bằng một phần ba so với những gì chúng tôi đang mong đợi. Các ước tính dựa trên các thông báo trước đây của Intel sẽ đưa Intel 4 vào khoảng 200 MTr / mm2. Vậy tại sao Loihi 2 lại quá thấp so với con số đó?

Đầu tiên có lẽ là nó là một chip thần kinh đa hình, và không phải là một thiết kế logic truyền thống. Lõi có tổng số SRAM ~ 25 MB cùng với tất cả logic, đối với 31mm2 chip có thể là một phần tốt của khu vực khuôn. Ngoài ra, ý tưởng chính của Intel với chip thần kinh đa hình là chức năng đầu tiên, thứ hai về hiệu suất và thứ ba về sức mạnh. Vì vậy, làm cho nó hoạt động đúng quan trọng hơn là làm cho nó hoạt động nhanh chóng, vì vậy không phải lúc nào cũng cần thô cho mật độ cao nhất. Sau đó, có một thực tế là nó vẫn là một con chip phát triển và nó cho phép Intel tinh chỉnh quy trình EUV của mình và kiểm tra phép in thạch bản chính xác mà không phải lo lắng nhiều về các khiếm khuyết do thư viện bóng bán dẫn dày đặc gây ra. Tôi chắc chắn sẽ còn nhiều điều nữa.

Để thêm một điểm cuối cùng, phần tóm tắt của chúng tôi đã suy đoán rằng IP thần kinh có khả năng được cung cấp thông qua các dịch vụ IP của Foundry Service của Intel trong tương lai.

Khung phần mềm dung nham mới

Bất kể khả năng xử lý, một trong những nền tảng chính của một hệ thống Neuromorphic là loại máy tính, và có lẽ việc viết phần mềm để tận dụng lợi thế của kiến ​​trúc như vậy sẽ khó khăn đến mức nào. Trong một cuộc thảo luận với Mike Davies của Intel, Giám đốc Phòng thí nghiệm thần kinh của Intel, chúng tôi đã mô tả rõ nhất rằng máy tính hiện đại cũng giống như một kiến ​​trúc thăm dò ý kiến ​​- mỗi chu kỳ nó lấy dữ liệu và xử lý. Ngược lại, tính toán Neuromorphic là một kiến ​​trúc dựa trên ngắt – nó hoạt động khi dữ liệu đã sẵn sàng. Điện toán thần kinh phụ thuộc nhiều vào miền thời gian hơn so với máy tính hiện đại, và do đó, cả khái niệm máy tính và các ứng dụng mà nó có thể hoạt động gần như trực giao với các kỹ thuật tính toán truyền thống. Ví dụ: trong khi học máy có thể được áp dụng cho tính toán thần kinh cấu trúc dưới dạng Mạng thần kinh xoắn ốc (SNN), các thư viện PyTorch và TensorFlow truyền thống không được xây dựng để kích hoạt SNN.

Hôm nay, như một phần của các thông báo, Intel đang tung ra một khung phần mềm cơ bản mới cho cộng đồng thần kinh sinh học có tên là Lava. Đây là một framework mã nguồn mở, không nằm dưới sự kiểm soát của Intel mà là của cộng đồng. Intel đã thúc đẩy một số công cụ ban đầu của mình như một phần của khuôn khổ và ý tưởng là theo thời gian, một ngăn xếp phần mềm đầy đủ có thể được phát triển cho tất cả mọi người tham gia vào tính toán Neuromorphic sử dụng, bất kể phần cứng (CPU, GPU, chip Neuromorphic) . Lava được thiết kế theo mô-đun, có thể kết hợp, có thể mở rộng, phân cấp và mã nguồn mở. Điều này bao gồm một giao diện cấp thấp để ánh xạ mạng thần kinh lên phần cứng thần kinh đa hình, truyền thông điệp không đồng bộ dựa trên kênh và tất cả các thư viện và tính năng đều được hiển thị thông qua Python. Phần mềm sẽ có sẵn để sử dụng miễn phí theo BSD-3 và LGPL-2.1 tại GitHub.

Hệ thống ban đầu

Phiên bản đầu tiên của Loihi 2 được triển khai trong các dịch vụ đám mây của Intel là Oheo Gulch, trông giống như một thẻ bổ trợ PCIe sử dụng FPGA để quản lý nhiều IO, cùng với một đầu nối bảng nối đa năng nếu cần. 31 mm2 chip là BGA, và ở đây chúng ta đang thấy một trong những đầu nối nội bộ của Intel để giữ chip BGA trên bảng phát triển.

Vào một ngày trong tương lai, Intel sẽ sản xuất một phiên bản 4 inch x 4 inch gọi là Kapoho Point, với tám chip trên bo mạch, được thiết kế để xếp chồng lên nhau và tích hợp vào một chiếc máy lớn hơn.

Với việc sở hữu một con chip nhỏ như vậy, tôi tự hỏi liệu có đáng để xây dựng nó với bộ điều khiển USB trên silicon hoặc có giao diện USB-to-Ethernet và cung cấp phần cứng trên thanh USB, giống như những gì Movidius của Intel từng được phân phối hay không . Chúng tôi đã hỏi Intel về việc mở rộng việc sử dụng Loihi 2 cho nhiều đối tượng tập trung vào phi nghiên cứu / phi thương mại hơn để mày mò và homebrew, tuy nhiên vì hiện tại đây vẫn là một dự án của Intel Labs, một trong những yếu tố quan trọng đối với nhóm là cộng tác tận tâm mà họ có với các đối tác để thúc đẩy phân khúc phát triển. Vì vậy, chúng ta sẽ phải đợi ít nhất một thế hệ khác hoặc hơn nữa để xem liệu có bất kỳ hệ thống Loihi nào trong tương lai kết thúc được cung cấp trên Amazon hay không.

Loihi 2 sẽ có sẵn cho các đối tác nghiên cứu sử dụng ngay từ hôm nay như một phần của DevCloud của Intel. Dự kiến ​​sẽ triển khai nghiên cứu / cộng tác tại chỗ trong 12-24 tháng tới.

Đọc liên quan

Bạn cũng có thể thích

Menu