NeRF là gì?

Trường bức xạ nơ-ron (NeRF) là một mạng nơ-ron có thể tái tạo các cảnh ba chiều phức tạp từ một phần tập hợp hình ảnh hai chiều. Cần có hình ảnh ba chiều trong các ứng dụng mô phỏng, trò chơi, phương tiện truyền thông và Internet vạn vật (IoT) khác nhau để các tương tác kỹ thuật số trở nên thực tế và chính xác hơn. NeRF học hình học cảnh, đối tượng và góc của một cảnh cụ thể. Sau đó, NeRF hiển thị các chế độ xem 3D tả thực từ các góc nhìn mới lạ, tự động tạo dữ liệu tổng hợp để lấp đầy khoảng trống.

Tìm hiểu về mạng nơ-ron

Tìm hiểu về IoT

Trường bức xạ nơ-ron được sử dụng trong những trường hợp nào?

NeRF có thể kết xuất các cảnh phức tạp và tạo hình ảnh cho các trường hợp sử dụng khác nhau.

Đồ họa máy tính và hoạt hình

Trong đồ họa máy tính, bạn có thể sử dụng NeRF để tạo hiệu ứng hình ảnh, mô phỏng và cảnh chân thực. NeRF chụp, kết xuất và chiếu các môi trường, nhân vật và hình ảnh khác một cách chân thực. NeRF thường được sử dụng để cải thiện đồ họa trò chơi điện tử và hoạt họa cho phim VX.

Hình ảnh y tế

NeRF tạo điều kiện tạo các cấu trúc giải phẫu toàn diện từ các bản quét 2D như MRI. Công nghệ của các trường này có thể tái tạo các phép biểu diễn chân thực cho mô và các cơ quan trong cơ thể, cung cấp hình ảnh bối cảnh hữu ích cho các bác sĩ và kỹ thuật viên y tế. 

Thực tế ảo

NeRF là một công nghệ quan trọng trong mô phỏng thực tế ảo và thực tế tăng cường. Vì có thể lập mô hình chính xác các cảnh 3D nên công nghệ này tạo điều kiện để tạo và khám phá các môi trường ảo thực tế. Tùy thuộc vào hướng xem của bạn, NeRF có thể hiển thị thông tin hình ảnh mới và thậm chí kết xuất các đối tượng ảo trong không gian thực.

Hình ảnh vệ tinh và quy hoạch

Hình ảnh vệ tinh cung cấp một loạt các hình ảnh mà NeRF có thể sử dụng để tạo ra các mô hình toàn diện về bề mặt trái đất. Giải pháp này rất hữu ích cho các trường hợp sử dụng chụp thực tế (RC) yêu cầu số hóa môi trường trong thế giới thực. Bạn có thể chuyển đổi dữ liệu vị trí không gian thành các mô hình 3D có độ chi tiết cao. Ví dụ: việc tái tạo hình ảnh trên không thành kết xuất cảnh quan thường được sử dụng trong quy hoạch đô thị vì cung cấp tài liệu tham khảo hữu ích cho bố cục trong thế giới thực của một khu vực. 

Hình ảnh sau đây cho thấy ví dụ về mô hình xây dựng 3D.

 

Trường bức xạ nơ-ron hoạt động như thế nào?

Hình ảnh 3D được kết xuất bằng máy tính, được tạo ra thông qua nhiều kỹ thuật đồ họa kỹ thuật số khác nhau, sẽ có một số thuộc tính riêng biệt xác định chất lượng và tính chân thực của hình ảnh. Ví dụ:

  • Các khía cạnh hình học, chẳng hạn như định vị, định hướng và tỷ lệ của các mô hình 3D trong cảnh
  • Các khía cạnh ánh sáng, chẳng hạn như bóng, độ sáng, màu sắc và phản xạ 
  • Độ trong suốt và độ mờ cho thấy ánh sáng đi qua các vật liệu như thủy tinh hoặc sương mù như thế nào
  • Khối lượng và mật độ, chẳng hạn như mật độ của khói hoặc mây
  • Kết cấu mô phỏng vật liệu như vải, gỗ hoặc kim loại

Sự lựa chọn màu sắc và phân bố cũng đóng một vai trò quan trọng trong tác động trực quan của hình ảnh. Việc tạo bóng xác định cách chiếu sáng các khu vực bề mặt khác nhau, tạo cảm giác về chiều sâu và hình dáng.

NeRF kết hợp các kỹ thuật đồ họa máy tính với kiến trúc mạng nơ-ron để xử lý tất cả các khía cạnh trước đó. 

Hình ảnh sau đây là một ví dụ về hình ảnh 3D được kết xuất bằng máy tính.

Kiến trúc của trường bức xạ nơ-ron

Để tạo phép biểu diễn cảnh 3D, NeRF sử dụng một khía cạnh nơ-ron được gọi là perceptron nhiều lớp (MLP). Đây là kiến trúc mạng nơ-ron được kết nối hoàn toàn. MLP là một mô hình nền tảng trong mạng nơ-ron và học sâu. Mô hình này được đào tạo để ánh xạ các tọa độ không gian và hướng xem tới các giá trị màu sắc và mật độ. MLP sử dụng một loạt các cấu trúc toán học sắp xếp các đầu vào, chẳng hạn như vị trí trong không gian 3D hoặc hướng xem 2D, để xác định giá trị màu sắc và mật độ tại mỗi điểm trong hình ảnh 3D. 

Mạng cũng học cách thay đổi độ sáng và màu sắc của các tia sáng trong cảnh. Bằng cách xây dựng hiểu biết về các tia này, được gọi là lập mô hình bức xạ, mạng có thể hiển thị các màu sắc và mật độ khác nhau từ các góc độ khác nhau. 

Tìm hiểu về học sâu

Các loại trường bức xạ nơ-ron

Các phiên bản đầu tiên của NeRF rất chậm và khó tối ưu hóa và cần đầu vào từ ảnh để so khớp ánh sáng sử dụng cùng một tia máy ảnh. Kể từ đó, đã có một số biến thể được cải thiện dựa trên công nghệ ban đầu.

PixelNeRF

Một trong những hình thức mới ban đầu của NeRF là PixelNeRF (CPVR 2021). Triển khai này đưa vào sử dụng một kiến trúc tích chập hoàn toàn, có thể dựa trên điều kiện các đầu vào hình ảnh đơn lẻ. Cách tiếp cận này sẽ không cần nhiều chế độ xem được hiệu chỉnh và có tổ chức, đồng thời giảm tổng tài nguyên điện toán cần thiết. Cách tiếp cận mới này đã hợp lý hóa quá trình tạo và tối ưu hóa NeRF.

Mega-NeRD

Mega-NeRD (CVPR 2022) là một khung NeRF khác đặc biệt hữu ích khi xử lý các cảnh quy mô lớn. Khung này cung cấp một thuật toán phân cụm hình học thay thế và cấu trúc mạng thưa thớt, cho phép xử lý hình ảnh với các điều kiện ánh sáng đa dạng. NeRF được tối ưu hóa này sử dụng lưới bức xạ nơ-ron thưa thớt (SNeRG) để chụp và kết xuất các môi trường trong thế giới thực một cách hiệu quả.

NSVF

Trường điểm ảnh ba chiều thưa thớt nơ-ron (NSVF) là một NeRF có thể bỏ qua bất kỳ điểm ảnh trống nào trong giai đoạn kết xuất, giúp tăng tốc độ kết xuất. Kỹ thuật này học các cấu trúc điểm ảnh trong các ô mạng, cho phép tạo ra hình ảnh chất lượng cao mà không cần điểm nhìn cụ thể.

Plenoptic voxel

Thay vì sử dụng mạng nơ-ron perceptron nhiều lớp, giải pháp sáng tạo Plenoptic Voxel (2021) sử dụng lưới 3D thưa thớt. Với lưới này, bạn có thể tăng tốc độ kết xuất của các mô phỏng mới trong khi vẫn duy trì độ trung thực của hình ảnh thông qua nội suy điểm ảnh ba chiều.

Các trường bức xạ nơ-ron kết xuất hình ảnh như thế nào?

Kết xuất nơ-ron là thuật ngữ chỉ quá trình tạo hình ảnh của NeRF. NeRF sử dụng nhiều kỹ thuật khác nhau để chuyển đổi dữ liệu thô thành các phép biểu diễn 3D chi tiết.

Kết xuất đồ họa

Các kỹ thuật kết xuất từ lĩnh vực đồ họa máy tính cho phép các mô hình NeRF chiếu và thao tác các cảnh theo hình học. Ví dụ:

  • Kỹ thuật truyền tia mô phỏng quan điểm của người dùng để tính khả năng hiển thị của các đối tượng 
  • Kỹ thuật dò tia mở rộng khái niệm này bằng cách mô phỏng hành vi vật lý của ánh sáng, bao gồm phản xạ, khúc xạ và bóng
  • Kỹ thuật mành hóa chuyển đổi thông tin véc-tơ 3D thành điểm ảnh trên màn hình 2D, sử dụng nhiều thuật toán khác nhau để mô phỏng hiệu ứng ánh sáng và kết cấu một cách hiệu quả

Kết xuất khối lượng

Kết xuất khối lượng là một chiến lược thiết yếu khác. Thuật toán xác định các giá trị màu đỏ, xanh lá cây, xanh dương và alpha (mật độ khối lượng) cho mỗi điểm ảnh trong không gian hoặc hình ảnh 3D. Những số liệu này ánh xạ đến vị trí tương ứng trong hình ảnh 2D.

Một kỹ thuật khác là tổng hợp chế độ xem, hoạt động ngược lại với kết xuất khối lượng. Kỹ thuật này xây dựng chế độ xem 3D từ một loạt các hình ảnh 2D. Tổng hợp chế độ xem tạo ra bố cục bán cầu biểu diễn đối tượng bằng cách sử dụng một loạt các hình ảnh được chụp từ các góc độ khác nhau. Quá trình này ghép mỗi hình ảnh 2D vào vị trí tương ứng xung quanh một đối tượng để tái tạo ở dạng 3D.

AWS có thể hỗ trợ các yêu cầu về trường bức xạ nơ-ron của bạn như thế nào?

Amazon Web Services (AWS) cung cấp hai dịch vụ để hỗ trợ các yêu cầu về NeRF của bạn.

AWS RoboMaker là dịch vụ mô phỏng dựa trên đám mây mà bạn có thể chạy, điều chỉnh quy mô và tự động hóa tác vụ mô phỏng mà không cần quản lý bất kỳ cơ sở hạ tầng nào. AWS RoboMaker giúp xây dựng môi trường mô phỏng nhanh hơn và giá cả phải chăng hơn bằng cách cung cấp thế giới mô phỏng và nhiều tài sản 3D khác nhau. Bạn có thể sử dụng các tài sản mô phỏng này để xây dựng môi trường mô phỏng phù hợp với độ chính xác được yêu cầu. Với AWS RoboMaker WorldForge, bạn có thể tạo ra hàng trăm thế giới mô phỏng dân cư trong nhà 3D đa dạng, do người dùng xác định chỉ trong vài phút.

AWS IoT TwinMaker là dịch vụ tạo ra bản sao kỹ thuật số của các hệ thống trong thế giới thực như tòa nhà, nhà máy, thiết bị công nghiệp và dây chuyền sản xuất. Dịch vụ này đem lại khả năng sử dụng dữ liệu hiện có từ nhiều nguồn, biểu diễn ảo bất kỳ môi trường vật lý nào và kết hợp các mô hình 3D hiện có với dữ liệu thực tế. Với AWS IoT TwinMaker, bạn có thể khai thác bản sao kỹ thuật số để tạo ra cái nhìn tổng thể về hoạt động của mình nhanh hơn và dễ dàng hơn.

Bắt đầu sử dụng trường bức xạ nơ-ron trên AWS bằng cách tạo tài khoản ngay hôm nay.

Các bước tiếp theo trên AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm
Tăng tốc độ đổi mới với các dịch vụ AI tạo sinh của AWS 
Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng Bậc miễn phí của AWS.

Đăng ký 
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng trong AWS Management Console.

Đăng nhập