Trí tuệ nhân tạo (Artificial Intelligence – AI) đang trở nên rất hot trong những năm gần đây nhờ vào những tiến triển mới thông qua phương pháp Deep Learning (“Học sâu”).
Trong bài viết này, tôi tóm tắt lại những điểm chính trong report của AIIndex.org về những tiến triển mới nhất của AI tính đến tháng 11/2017.
Có 3 mục chính mà chúng ta sẽ điểm qua, bao gồm:
- Khối lượng các hoạt động
- Tiến triển về kĩ thuật
- Tiến về một khả năng tương đương con người?
Khối lượng các hoạt động
Trong giới nghiên cứu (Academia)
- Số lượng các bài báo nghiên cứu về Trí tuệ nhân tạo được xuất bản trong năm 2017 đã tăng 9 lần so với năm 1996 (So sánh con số này với con số 6 lần của số lượng bài nghiên cứu trong mảng Khoa học máy tính (Computer Science) nói chung)
- Số lượng sinh viên Stanford đăng ký các môn học về AI đã tăng 11 lần so với năm 1996.
- Số lượng người tham dự ở các hội thảo (conference) về AI cho thấy sự dịch chuyển từ hướng tiếp cận dùng phương pháp Lý luận tượng trưng (Symbolic Reasoning) sang Máy học (Machine Learning) và Học sâu (Deep Learning).
Trong công nghiệp (Industry)
- Từ 2000→2017, số lương startup ở Mỹ phát triển các hệ thống AI đã tăng 14 lần, lên 600+ startups vào năm 2017
- Từ 2000→2017, số tiền đầu tư từ Các quỹ đầu tư mạo hiểm (Venture Capital – VC) vào các AI startups đã tăng 6 lần.
- Từ 2013→2017, tỉ lệ các công việc ở Mỹ đòi hỏi các kĩ năng về AI đã tăng 4.5 lần. Vào năm 2017, các kĩ năng được tuyển nhiều nhất ở Mỹ trong mảng Trí tuệ nhân tạo lần lượt là:
- Machine Learning: ~12k vị trí
- Deep Learning: ~7k vị trí
- Xử lí ngôn ngữ tự nhiên (Natual Language Processing – NLP): ~5k vị trí
- Thị giác máy tính (Computer Vision): ~3k vị trí
- Nhận dạng giọng nói (Speech Recognition): ~1.5k vị trí
Phần mềm mã nguồn mở (Open source Software)
- Số lượng các gói phần mềm (software packages) được “star” (tức được quan tâm) ở GitHub tăng hơn 4 lần đối với thư viện TensorFlow. Các vị trí tiếp theo thuộc về Scikit-Learn, Caffe và Keras
Tiến triển về kĩ thuật
Thị giác (Vision)
- Phát hiện vật (Object Detection): Độ chính xác trong bài toán phân loại hình dựa vào vật có trong hình đã tăng từ 71.5% (2010) → 97.5% (2017): vượt qua khả năng của con người (~95%)
- Trả lời câu hỏi dựa vào thị giác (Visual Question Answering): Độ chính xác tăng từ 55% (2015)→68% (2017): vẫn thua con người (~ 82%)
Hiểu ngôn ngữ tự nhiên (Natual Language Understanding)
- Phân tích cú pháp (Parsing): Độ chính xác khi phân tích thành phần câu (constituencies) trong dữ liệu Penn Treebank WSJ:
- Với các câu có ít hơn 40 từ: Độ chính xác: 85% (1995) → ~93% (2012)
- Với các câu dài hơn 40 từ: ~87% (2003) → ~94% (2017)
- Dịch máy (Machine translation): Độ chính xác tính theo chỉ số Bleu trong cuộc thi WMT cũng có nhiều tiến triển.
- Hỏi và trả lời (Question Answering): Độ chính xác tăng từ ~60% (vào 8/2015) → ~79% (11/2017), đánh giá trên tập dữ liệu SQuAD v1.1. Độ chính xác của con người trong nhiệm vụ này là khoảng 82%.
- Nhận diện giọng nói (Speech Recognition): Khi đánh giá trên tập dữ liệu audio cuộc gọi Switchboard HUB5’00, độ chính xác trong khả năng nhận diện giọng nói của máy đã tăng từ độ chính xác ~84% (2011) → ~95% (2017), bằng khả năng của con người.
Chứng minh định lí (Theorem proving) và Giải các bài toán SAT (Boolean Satisfiability Problem – SAT) đều có những tiến triển đáng kể.
Tiến về một khả năng tương đương con người?
Do đặc tính tự động hóa của mình, máy tính, từ khi ra đời vào những năm 1970, vốn đã có khả năng làm một số việc tốt hơn con người như việc tính toán với tốc độ cực nhanh.
Tuy nhiên khả năng của máy tính lại thua xa con người khi kể đến những vấn đề phải “hiểu” hay đòi hỏi các giác quan như: Hỏi-Đáp (Question Answering), chơi games và chẩn đoán bệnh tật.
Điểm hạn chế nổi trội của những hệ thống AI hiện nay là mặc dù hệ thống đó có khả năng làm tốt một công việc hay giải một bài toán cụ thể nào đó (như phát hiện vật thể, chơi một game nào đó), khi chúng ta thay đổi bài toán hay vấn đề cần giải đi một chút thì hệ thống AI đó nhiều khả năng sẽ xử lí kém đi đáng kể.
Vì thế trí tuệ nhân tạo hiện nay vẫn còn ở mức độ “hạn hẹp” (narrow AI) nghĩa là chúng ta cần những hệ thống chuyên biệt cho những bài toán khác nhau. Việc phát triển những hệ thống AI tổng quát (general AI) có khả năng suy luận như con người vẫn còn là một dấu hỏi lớn.
Trong những năm gần đây, phương pháp Học sâu (Deep Learning) với nhiều kết quả nổi bật và đặc biệt là khả năng “học” được câu trả lời thông qua các dữ liệu ví dụ mà không cần người nghiên cứu phải tỉ mỉ phân tích bài toán cần giải và lập trình một khung sườn cố định cho máy đã khơi dậy một niềm hứng khởi mới về một tương lai của Trí tuệ thông minh tổng quát.
Đọc toàn bộ bài báo cáo về chỉ số AI 2017 ở đây.
Cập nhật 2022
- Một bài viết cập nhật về AI mà bạn sẽ quan tâm: Hướng dẫn học lập trình trí tuệ nhân tạo cho người mới bắt đầu.
To receive auto email updates about new posts, please register using this form: