Học sâu là gì?

Học sâu là một phương thức trong lĩnh vực trí tuệ nhân tạo (AI), được sử dụng để dạy máy tính xử lý dữ liệu theo cách được lấy cảm hứng từ bộ não con người. Mô hình học sâu có thể nhận diện nhiều hình mẫu phức tạp trong hình ảnh, văn bản, âm thanh và các dữ liệu khác để tạo ra thông tin chuyên sâu và dự đoán chính xác. Bạn có thể sử dụng các phương pháp học sâu để tự động hóa các tác vụ thường đòi hỏi trí tuệ con người, chẳng hạn như mô tả hình ảnh hoặc chép lời một tập tin âm thanh. 

Tại sao mô hình học sâu lại quan trọng?

Trí tuệ nhân tạo (AI) cố gắng đào tạo để giúp máy tính có thể tư duy và học hỏi như con người. Công nghệ học sâu thúc đẩy nhiều ứng dụng AI được sử dụng trong các sản phẩm hàng ngày, chẳng hạn như:

  • Trợ lý kỹ thuật số
  • Điều khiển tivi từ xa kích hoạt bằng giọng nói
  • Phát hiện gian lận
  • Nhận dạng khuôn mặt tự động

Đây cũng là một thành phần quan trọng của các công nghệ mới nổi như xe tự lái, thực tế ảo, v.v. 

Mô hình học sâu là các tập tin máy tính đã được các nhà khoa học dữ liệu đào tạo để thực hiện các tác vụ bằng một thuật toán hoặc hệ thống các bước định sẵn. Nhiều doanh nghiệp sử dụng các mô hình học sâu để phân tích dữ liệu và đưa ra dự đoán trong nhiều ứng dụng khác nhau.

Mô hình học sâu có những công dụng nào?

Mô hình học sâu có một số trường hợp sử dụng trong lĩnh vực ô tô, hàng không vũ trụ, sản xuất, điện tử, nghiên cứu y học và nhiều lĩnh vực khác. Sau đây là một vài ví dụ về học sâu:

  • Xe tự lái sử dụng các mô hình học sâu để tự động phát hiện biển báo giao thông và người đi bộ.
  • Hệ thống quốc phòng sử dụng mô hình học sâu để tự động gắn cờ các khu vực được quan tâm trong ảnh vệ tinh.
  • Phân tích hình ảnh y khoa sử dụng học sâu để tự động phát hiện các tế bào ung thư trong chẩn đoán y tế.
  • Các nhà máy sử dụng ứng dụng học sâu để tự động phát hiện con người hoặc vật thể khi những đối tượng này đang nằm trong khoảng cách không an toàn của máy móc.

Bạn có thể nhóm các trường hợp sử dụng mô hình học sâu khác nhau này thành bốn loại chính – thị giác máy tính, nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên (NLP) và công cụ đề xuất.

Thị giác máy tính

Thị giác máy tính là khả năng của máy tính thực hiện trích xuất dữ liệu cũng như thông tin chuyên sâu từ hình ảnh và video. Máy tính có thể sử dụng các kỹ thuật học sâu để hiểu hình ảnh theo cách giống như con người. Thị giác máy tính được ứng dụng trong nhiều trường hợp, chẳng hạn như:

  • Kiểm duyệt nội dung để tự động loại bỏ nội dung không an toàn hoặc không phù hợp khỏi kho lưu trữ hình ảnh và video
  • Nhận diện khuôn mặt để xác định khuôn mặt cũng như các đặc điểm như mở mắt, đeo kính và để râu
  • Phân loại hình ảnh để xác định logo thương hiệu, quần áo, đồ bảo hộ và các chi tiết hình ảnh khác

Nhận dạng giọng nói

Các mô hình học sâu có thể phân tích giọng nói con người, bất kể mẫu giọng, cao độ, tông, ngôn ngữ và giọng vùng miền khác nhau. Trợ lý ảo như Amazon Alexa và phần mềm phiên âm tự động sử dụng nhận dạng giọng nói để thực hiện các tác vụ sau:

  • Hỗ trợ các nhân viên trực tổng đài và tự động phân loại cuộc gọi.
  • Chuyển đổi các cuộc trò chuyện về y khoa thành văn bản trong thời gian thực.
  • Tạo phụ đề chính xác cho video và bản ghi âm cuộc họp để mở rộng phạm vi tiếp cận nội dung.

Kỹ thuật xử lý ngôn ngữ tự nhiên

Máy tính sử dụng các thuật toán học sâu để thu thập thông tin chuyên sâu và ý nghĩa từ dữ liệu văn bản và tài liệu. Khả năng xử lý văn bản tự nhiên, do con người tạo ra này có một số trường hợp sử dụng, kể cả trong các chức năng sau:

  • Tổng đài viên ảo và chatbot tự động
  • Tự động tóm tắt tài liệu hoặc bài viết tin tức
  • Phân tích nghiệp vụ thông minh các tài liệu dài, chẳng hạn như các email và biểu mẫu
  • Lập chỉ mục các cụm từ quan trọng thể hiện cảm xúc, chẳng hạn như những bình luận tích cực và tiêu cực trên mạng xã hội

Công cụ đề xuất

Ứng dụng có thể sử dụng các phương pháp học sâu để theo dõi hoạt động của người dùng và phát triển các đề xuất cá nhân hóa. Các phương pháp này có thể phân tích hành vi của nhiều người dùng khác nhau và giúp họ khám phá các sản phẩm hoặc dịch vụ mới. Ví dụ: nhiều công ty truyền thông và giải trí, chẳng hạn như Netflix, Fox và Peacock, sử dụng mô hình học sâu để đưa ra các video đề xuất cá nhân hóa.

Mô hình học sâu hoạt động như thế nào?

Các thuật toán học sâu là các mạng nơ-ron được lập mô hình theo bộ não con người. Ví dụ: một bộ não con người chứa hàng triệu nơ-ron được kết nối với nhau, làm việc cùng nhau để tìm hiểu và xử lý thông tin. Tương tự, các mạng nơ-ron học sâu, hay mạng nơ-ron nhân tạo, được tạo thành từ nhiều lớp nơ-ron nhân tạo hoạt động cùng nhau bên trong máy tính.

Các nơ-ron nhân tạo là những mô-đun phần mềm được gọi là nút, sử dụng các phép toán để xử lý dữ liệu. Các mạng nơ-ron nhân tạo là những thuật toán học sâu sử dụng các nút này để giải quyết các vấn đề phức tạp.

Mạng học sâu bao gồm những thành phần nào?

Một mạng nơ-ron chuyên sâu có các thành phần sau.

Lớp đầu vào

Một mạng nơ-ron nhân tạo sẽ có một số nút để nhập dữ liệu đầu vào. Các nút này tạo nên lớp đầu vào của hệ thống.

Lớp ẩn

Lớp đầu vào xử lý và chuyển dữ liệu đến các lớp sâu hơn trong mạng nơ-ron. Các lớp ẩn này xử lý thông tin ở các cấp độ khác nhau, thích ứng với hành vi của mình khi nhận được thông tin mới. Các mạng học sâu có hàng trăm lớp ẩn có thể được dùng để phân tích một vấn đề từ nhiều góc độ khác nhau.

Ví dụ: nếu bạn phải phân loại hình ảnh của một loài vật chưa xác định, bạn sẽ cần so sánh hình ảnh này với các loài vật đã biết. Chẳng hạn, bạn sẽ quan sát hình dáng của cặp mắt, đôi tai, kích thước, số chi và hình mẫu lông của loài vật đó. Bạn sẽ cố gắng xác định các hình mẫu, chẳng hạn như sau:

  • Loài vật có móng guốc nên nó có thể là bò hoặc hươu.
  • Loài vật có mắt mèo nên nó có thể là một loài mèo hoang dã nào đó.

Các lớp ẩn trong mạng nơ-ron chuyên sâu hoạt động theo cùng một cách. Nếu một thuật toán học sâu đang cố gắng phân loại một hình ảnh động vật, mỗi lớp ẩn của thuật toán này sẽ xử lý một đặc điểm khác nhau của con vật và cố gắng phân loại chính xác nó.

Lớp đầu ra

Lớp đầu ra bao gồm các nút xuất dữ liệu. Các mô hình học sâu xuất ra đáp án "có" hoặc "không" chỉ có hai nút trong lớp đầu ra. Mặt khác, các mô hình xuất ra nhiều đáp án hơn sẽ có nhiều nút hơn. 

Mô hình học sâu có ý nghĩa gì trong ngữ cảnh máy học?

Học sâu là một lĩnh vực con của máy học. Các thuật toán học sâu xuất hiện nhằm nỗ lực cải thiện hiệu quả của các kỹ thuật máy học truyền thống. Các phương pháp máy học truyền thống đòi hỏi công sức đáng kể để đào tạo phần mềm. Chẳng hạn, để nhận dạng hình ảnh động vật, bạn cần phải thực hiện như sau:

  • Dán nhãn hàng trăm nghìn hình ảnh động vật theo cách thủ công.
  • Cho các thuật toán máy học xử lý những hình ảnh đó.
  • Kiểm thử các thuật toán này trên một tập hình ảnh không xác định.
  • Xác định lý do cho việc có một số kết quả không chính xác.
  • Cải thiện tập dữ liệu bằng cách dán nhãn các hình ảnh mới nhằm giúp kết quả thêm chính xác.

Quy trình này được gọi là học có giám sát. Trong quy trình học có giám sát, độ chính xác của kết quả chỉ cải thiện khi bạn có một tập dữ liệu đủ đa dạng và phong phú. Ví dụ: thuật toán có thể xác định chính xác mèo đen nhưng không phải mèo trắng do tập dữ liệu đào tạo có chứa nhiều hình ảnh mèo đen hơn. Trong trường hợp đó, bạn sẽ cần phải dán nhãn thêm hình ảnh mèo trắng và đào tạo các mô hình máy học một lần nữa.

So với máy học, mô hình học sâu mang lại những lợi ích gì?

So với máy học truyền thống, mạng học sâu có những lợi ích sau. 

Xử lý hiệu quả dữ liệu phi cấu trúc 

Các phương pháp máy học nhận thấy rất khó để xử lý dữ liệu phi cấu trúc, ví dụ như các tài liệu văn bản, do tập dữ liệu đào tạo có thể có tính biến động vô hạn. Mặt khác, các mô hình học sâu có thể hiểu rõ dữ liệu phi cấu trúc và đưa ra các nhận xét chung mà không cần trích xuất tính năng thủ công. Chẳng hạn, một mạng nơ-ron có thể nhận ra hai câu đầu vào khác nhau có cùng một ý nghĩa:

  • Bạn có thể chỉ cho tôi cách thanh toán không?
  • Tôi có thể chuyển tiền bằng cách nào? 

Khám phá những mối quan hệ và mẫu ẩn

Ứng dụng học sâu có thể phân tích sâu hơn một lượng lớn dữ liệu và hé lộ nhiều thông tin chuyên sâu mới có thể chưa được đào tạo. Ví dụ: giả sử một mô hình học sâu được đào tạo để phân tích giao dịch mua của người tiêu dùng. Mô hình này chỉ có dữ liệu cho các mặt hàng bạn đã mua. Tuy nhiên, mạng nơ-ron nhân tạo có thể đề xuất các mặt hàng mới mà bạn chưa từng mua bằng cách so sánh các hình mẫu mua của bạn với nhiều khách hàng tương tự khác.

Học không giám sát

Các mô hình học sâu có thể học hỏi và cải thiện dần theo thời gian dựa trên hành vi của người dùng. Những mô hình này không yêu cầu các tập dữ liệu được dán nhãn phải có tính biến động cao. Ví dụ, một mạng nơ-ron tự động chỉnh sửa hoặc đề xuất từ ngữ bằng cách phân tích hành vi đánh máy của bạn. Giả sử mô hình đó được đào tạo bằng tiếng Anh và có thể kiểm tra ngữ pháp tiếng Anh. Tuy nhiên, nếu bạn thường xuyên gõ các từ không phải tiếng Anh, chẳng hạn như danke, mạng nơ-ron sẽ tự động học hỏi và chỉnh sửa cả những từ này.

Xử lý dữ liệu dễ biến động

Các tập dữ liệu dễ biến động có tính biến động cao. Các khoản trả nợ ngân hàng là một ví dụ. Mạng nơ-ron học sâu cũng có thể phân loại và sắp xếp dữ liệu đó, chẳng hạn như bằng cách phân tích các giao dịch tài chính và gắn cờ một số giao dịch đó để tiến hành phát hiện gian lận.

Mô hình học sâu có những thách thức nào?

Học sâu là một công nghệ tương đối mới, do đó khi triển khai thực tiễn sẽ có một số thách thức.

Số lượng lớn dữ liệu chất lượng cao

Các thuật toán học sâu sẽ cho ra kết quả tốt hơn khi được đào tạo trên dữ liệu chất lượng cao theo số lượng lớn. Các giá trị ngoại lai hoặc sai sót trong tập dữ liệu đầu vào của bạn có thể ảnh hưởng đáng kể đến quy trình học sâu. Ví dụ: trong ví dụ về hình ảnh động vật của chúng tôi, mô hình học sâu có thể phân loại máy bay là một con rùa nếu tập dữ liệu vô tình có các hình ảnh không phải động vật.

Để tránh những sai lệch như vậy, bạn phải làm sạch và xử lý một lượng lớn dữ liệu trước khi có thể đào tạo các mô hình học sâu. Quy trình tiền xử lý dữ liệu đầu vào đòi hỏi một lượng lớn dung lượng từ kho lưu trữ dữ liệu.

Năng lực xử lý lớn 

Các thuật toán học sâu thiên về điện toán và yêu cầu cơ sở hạ tầng có đủ năng lực điện toán để hoạt động đúng cách. Nếu không, các thuật toán này sẽ rất mất thời gian để xử lý kết quả. 

Mô hình học sâu trong đám mây mang lại những lợi ích gì?

Việc chạy các thuật toán học sâu trên cơ sở hạ tầng đám mây có thể giúp vượt qua nhiều thách thức sau. Bạn có thể sử dụng mô hình học sâu trong đám mây để thiết kế, phát triển và đào tạo các ứng dụng học sâu nhanh hơn. 

Tốc độ

Bạn có thể đào tạo các mô hình học sâu nhanh hơn bằng cách sử dụng các cụm GPU và CPU để thực hiện các phép toán phức tạp theo yêu cầu từ mạng nơ-ron của bạn. Sau đó, bạn có thể triển khai các mô hình này để xử lý một lượng lớn dữ liệu và tạo ra kết quả có độ liên quan tăng dần theo thời gian.

Khả năng mở rộng

Với nhiều tài nguyên theo nhu cầu đa dạng có sẵn thông qua đám mây, bạn có thể truy cập vào các tài nguyên phần cứng gần như không giới hạn để giải quyết các mô hình học sâu ở mọi kích thước. Các mạng nơ-ron của bạn có thể tận dụng nhiều bộ xử lý để phân bổ khối lượng công việc liền mạch và hiệu quả trên các loại bộ xử lý với số lượng khác nhau.

Mô hình học sâu trên AWS là gì?

Dịch vụ học sâu của AWS khai thác sức mạnh của điện toán đám mây để bạn có thể mở rộng mạng nơ-ron học sâu của mình với chi phí thấp hơn và tối ưu hóa tốc độ của chúng. Bạn cũng có thể sử dụng các dịch vụ AWS để quản lý toàn diện các ứng dụng học sâu cụ thể, chẳng hạn như sau:

  • Sử dụng Amazon Rekognition để bổ sung các tính năng thị giác máy tính được đào tạo trước hoặc có thể tùy chỉnh vào ứng dụng của bạn
  • Sử dụng Amazon Transcribe để tự động nhận dạng và phiên âm giọng nói chính xác
  • Sử dụng Amazon Lex để xây dựng các chatbot thông minh hiểu ý định, giữ nguyên ngữ cảnh trò chuyện và tự động hóa các tác vụ đơn giản trên nhiều ngôn ngữ

Bắt đầu sử dụng dịch vụ học sâu trên AWS với Amazon SageMaker để xây dựng, đào tạo và triển khai các mạng nơ-ron trên quy mô lớn một cách nhanh chóng và dễ dàng. Bạn cũng có thể sử dụng AMI học sâu của AWS để xây dựng môi trường tùy chỉnh và luồng công việc dành cho mô hình học sâu. Tạo tài khoản AWS miễn phí để bắt đầu ngay hôm nay!

Các bước tiếp theo để sử dụng công nghệ Học sâu trên AWS

Tham khảo các tài nguyên bổ sung liên quan đến sản phẩm
Tìm hiểu thêm về các Dịch vụ học sâu 
Đăng ký tài khoản miễn phí

Nhận ngay quyền sử dụng bậc miễn phí của AWS. 

Đăng ký 
Bắt đầu xây dựng trong bảng điều khiển

Bắt đầu xây dựng trong AWS Management Console.

Đăng nhập