Google Brain là gì và vai trò của nó trong phát triển trí tuệ nhân tạo là gì?
Trong một thời gian dài, các kỹ sư và nhà khoa học đã tìm cách làm cho trí tuệ nhân tạo (AI) hoạt động giống như bộ não con người. Kỳ tích này trở nên khả thi với việc thành lập Google Brain, một nhóm nghiên cứu AI, vào năm 2011. Vậy Google Brain đòi hỏi điều gì, và những tiến bộ và đột phá của nó trong AI là gì?
Mục Lục
Google Brain bắt đầu như thế nào
Bộ não con người có thể là tạo vật phức tạp nhất—một cỗ máy sinh học phức tạp với nhiều khu vực thực hiện đồng thời các nhiệm vụ khác nhau. Tuy nhiên, các nhà phát triển AI đặt mục tiêu làm cho các hệ thống AI thực hiện các hoạt động phức tạp và giải quyết các vấn đề như con người.
Vào năm 2011, Andrew Ng, giáo sư đại học, Jeff Dean, đồng nghiệp của Google và Greg Corrado, Nhà nghiên cứu của Google, đã thành lập Google Brain với tư cách là một nhóm nghiên cứu để khám phá AI.
Ban đầu, đội không có tên chính thức; sau khi Ng gia nhập Google X, anh bắt đầu cộng tác với Dean và Corrado để tích hợp các quy trình học sâu vào cơ sở hạ tầng hiện có của Google. Cuối cùng, nhóm đã trở thành một phần của Google Research và được gọi là “Google Brain”.
Các thành viên nhóm sáng lập Brain đã tìm cách tạo ra trí thông minh có thể học một cách độc lập từ lượng lớn dữ liệu. Họ cũng nhằm mục đích giải quyết các thách thức của mạng AI hiện có, bao gồm hiểu ngôn ngữ, nhận dạng giọng nói và hình ảnh.
Năm 2012, Google Brain gặp phải một bước đột phá. Các nhà nghiên cứu đã đưa hàng triệu hình ảnh thu được từ YouTube vào mạng thần kinh để đào tạo nó về nhận dạng mẫu mà không cần thông tin trước. Sau cuộc thử nghiệm, mạng lưới đã nhận ra những con mèo với độ chính xác cao. Bước đột phá này đã mở đường cho một loạt các ứng dụng.
Sự phát triển của Google Brain và sự phát triển AI
Google Brain đã cách mạng hóa cách các kỹ sư phần mềm nghĩ về AI, đóng góp đáng kể vào sự phát triển của nó. Nhóm Brain đã đạt được những kết quả to lớn trong nhiều hoạt động học máy—những thành công của nó đã tạo nên nền tảng cho khả năng nhận dạng giọng nói và hình ảnh cũng như xử lý ngôn ngữ tự nhiên của AI.
Xử lý ngôn ngữ tự nhiên
Một trong những đóng góp quan trọng nhất của nhóm Brain là sự phát triển của học sâu và sự tiến bộ của Xử lý ngôn ngữ tự nhiên (NLP).
NLP liên quan đến việc dạy máy tính ngôn ngữ của con người và giúp chúng tương tác, mang lại kết quả được cải thiện khi tiếp tục tiếp xúc. Chẳng hạn, Google Assistant sử dụng NLP để hiểu các truy vấn của bạn và trả lời một cách thích hợp.
Tầm nhìn máy tính
Nhóm Brain đã đóng góp cho Thị giác máy tính—xác định hình ảnh và đối tượng từ dữ liệu trực quan. Vào năm 2012, Google Brain đã giới thiệu một mạng thần kinh để phân loại hình ảnh thành 1000 danh mục. Hiện tại, có một số cách sử dụng không mong muốn cho Computer Vision đang được sử dụng ngay bây giờ.
Dịch máy thần kinh
Google Brain cũng đã phát triển Dịch máy thần kinh (NMT). Trước khi nhóm Brain ra đời, hầu hết các hệ thống dịch thuật đều sử dụng phương pháp thống kê; Neural Machine Translation của Google là một bản nâng cấp đáng kể.
Hệ thống dịch toàn bộ câu cùng một lúc, dẫn đến bản dịch chính xác hơn và nghe có vẻ tự nhiên. Google Brain cũng đã phát triển các mô hình mạng có thể phiên âm chính xác lời nói.
3 ứng dụng sử dụng Google Brain
Nhóm Brain đã đi tiên phong trong nhiều ứng dụng của Google kể từ khi thành lập vào năm 2011, bao gồm các ứng dụng sau.
1. Trợ lý Google
Trợ lý Google, được tìm thấy trong nhiều điện thoại thông minh ngày nay, cung cấp thông tin được cá nhân hóa, giúp bạn đặt lời nhắc và báo thức, thực hiện cuộc gọi đến nhiều địa chỉ liên hệ khác nhau và thậm chí điều khiển các thiết bị thông minh xung quanh nhà.
Trợ lý này dựa vào các thuật toán máy học do Google Brain cung cấp để diễn giải lời nói và đưa ra phản hồi chính xác. Với các thuật toán này, Trợ lý Google giúp cuộc sống của bạn trở nên dễ dàng hơn bằng cách tìm hiểu các tùy chọn của bạn và sau thời gian dài sử dụng, Trợ lý sẽ hiểu bạn hơn nữa.
2. Google Dịch
Hệ thống Google Dịch sử dụng Dịch máy thần kinh, sử dụng các thuật toán học sâu từ Google Brain. Điều này cho phép Google Dịch xác định, hiểu và dịch chính xác văn bản sang ngôn ngữ mong muốn.
NMT cũng sử dụng cách tiếp cận mô hình hóa “sequence-to-sequence”. Điều này có nghĩa là các cụm từ và toàn bộ câu được dịch trong một lần thay vì từng từ một. Theo thời gian, khi bạn tương tác với Google Dịch, nó sẽ thu thập thông tin, cho phép nó cung cấp các bản dịch nghe tự nhiên hơn trong tương lai.
Nếu bạn cần thông tin chi tiết hơn, hãy xem cách dịch âm thanh bằng Google Dịch trên điện thoại Android của bạn.
3. Google Ảnh
Mặc dù Google Photos chủ yếu là một ứng dụng lưu trữ ảnh và video dựa trên đám mây, nhưng ứng dụng này sử dụng các thuật toán của Google Brain để sắp xếp và phân loại phương tiện một cách tự động. Điều này cho phép Google Photos giúp bạn quản lý ảnh được lưu trữ của mình dễ dàng hơn. Vì vậy, khi bạn chụp ảnh, Google Photos sẽ nhận ra bạn, bạn bè, đối tượng của bạn và thậm chí cả các địa danh và sự kiện có trong ảnh.
Ứng dụng này cũng thêm các thẻ để giúp bạn nhóm ảnh để tham khảo sau này. Tính năng này đặc biệt hữu ích cho việc tìm kiếm và chia sẻ kỷ niệm với bạn bè sau này.
Đẩy lùi ranh giới với Deep Learning
Google Brain, kể từ khi thành lập, đã mở rộng đáng kể AI bằng cách sử dụng các thuật toán mạng thần kinh hàng đầu. Nhóm Brain đã đóng góp vào những bước đột phá về nhận dạng giọng nói và hình ảnh, khung máy học và xử lý ngôn ngữ tự nhiên.