Ngoài học máy: Nắm bắt các mối quan hệ nhân quả

Giải Trí/Cuộc Sống

Các công ty sử dụng máy học để xác định rằng một chút hiểu biết sâu sắc về kinh doanh có thể học hỏi từ các nhà khoa học đã thành công trong việc định vị kim nhỏ nhất trong số họ, hạt bosun Higgs.

Hang động Muon Solenoid nhỏ gọn tại Tổ chức nghiên cứu hạt nhân châu Âu tại Meyrin, Thụy Sĩ, ngày 10 tháng 2 năm 2015

Trí tuệ nhân tạo đang trở thành một trong những công nghệ quan trọng nhất trong thời đại của chúng ta. Mỗi ngày chúng ta có thể đọc về những tiến bộ AI mới nhất từ ​​các công ty khởi nghiệp và các công ty lớn. Các công nghệ AI đang tiếp cận hoặc vượt qua mức hiệu suất của con người về tầm nhìn, nhận dạng giọng nói, dịch ngôn ngữ và các lĩnh vực khác của con người. Những tiến bộ của máy học, như học sâu, đã đóng một vai trò trung tâm trong những thành tựu gần đây của AI, giúp máy tính có thể được đào tạo bằng cách ăn và phân tích lượng lớn dữ liệu thay vì được lập trình rõ ràng.

Học sâu là một kỹ thuật thống kê mạnh mẽ để phân loại các mẫu bằng cách sử dụng các tập dữ liệu đào tạo lớn và mạng lưới thần kinh AI nhiều lớp. Về cơ bản, đây là một phương pháp để máy móc học hỏi từ tất cả các loại dữ liệu, dù có cấu trúc hay không cấu trúc, được mô hình hóa một cách lỏng lẻo theo cách não bộ sinh học học các khả năng mới.

Học máy có thể được áp dụng cho bất kỳ lĩnh vực kiến ​​thức nào do khả năng chúng tôi thu thập dữ liệu có giá trị trong hầu hết mọi lĩnh vực quan tâm. Nhưng phương pháp học máy hẹp hơn và chuyên biệt hơn con người. Có nhiều nhiệm vụ mà chúng không hiệu quả với các công nghệ hiện đại. Trong Khoa học, các giáo sư Erik Brynjolfsson và Tom Mitchell đã xác định các tiêu chí chính giúp phân biệt các nhiệm vụ đặc biệt phù hợp cho việc học máy với những điều không phải.

Bao gồm các:

  • Nhiệm vụ ánh xạ các đầu vào được xác định rõ thành các đầu ra được xác định rõ
  • Các tập dữ liệu lớn tồn tại hoặc có thể được tạo có chứa các cặp đầu vào-đầu ra như vậy
  • Khả năng đang học nên tương đối tĩnh
  • Không cần giải thích chi tiết về cách quyết định đã được đưa ra

Và như chúng tôi thường xuyên nhắc nhở, mối tương quan không ngụ ý nhân quả . Học máy là một kỹ thuật mô hình thống kê, giống như khai thác dữ liệu và phân tích kinh doanh, tìm và tương quan các mẫu giữa đầu vào và đầu ra mà không nhất thiết phải nắm bắt các mối quan hệ nguyên nhân và kết quả của chúng. Xác định mối quan hệ nhân quả đòi hỏi các phương pháp khoa học cố gắng và thực sự, nghĩa là bằng chứng thực nghiệm và có thể đo lường được theo các giải thích và dự đoán có thể kiểm chứng.

Vật lý, sinh học và các ngành khoa học tự nhiên khác từ lâu đã dựa vào các mô hình và nguyên tắc khoa học để hiểu và giải thích các mối quan hệ nguyên nhân và kết quả cho phép chúng phát hiện các tín hiệu mờ nhạt trong các tập dữ liệu lớn và / hoặc nhiễu - kim châm ngôn trong một đống cỏ khô. Ví dụ: theo dõi các vật thể gần Trái đất có khả năng nguy hiểm, di chuyển nhanh dựa trên việc phát hiện những thay đổi rất nhỏ trên bầu trời. Tương tự như vậy, tìm kiếm các hành tinh ngoài hệ mặt trời có kích thước Trái đất dựa trên việc phát hiện những thay đổi mờ nhạt trong ánh sáng của một ngôi sao do một hành tinh tiềm năng nhanh chóng đi qua. Cho dù chúng tôi có thể truy cập bao nhiêu dữ liệu, gần như không thể phát hiện các tín hiệu yếu, nhiễu liên quan đến một trong hai nhiệm vụ mà không có các mô hình được phát triển trong vài trăm năm qua cho thấy một thực thể quan tâm cần được nghiên cứu thêm.

Các mô hình khoa học như vậy đã cho phép phát hiện ra các hạt cơ bản có thời gian tồn tại rất ngắn, như boson Higgs, giữa lượng dữ liệu khổng lồ được tạo ra bởi các máy gia tốc hạt năng lượng cao. Trước khi một proton duy nhất được bắn qua máy va chạm, máy tính đã tính toán tất cả các kết quả có thể xảy ra của một vụ va chạm theo vật lý đã biết, đã giải thích một câu chuyện của New York Times trên Large Hadron Collider. Bất kỳ sự va chạm bất ngờ nào trong dữ liệu thực ở một số năng lượng có thể là tín hiệu của vật lý chưa biết, một hạt mới.

Phương pháp thống kê đáp ứng các mô hình dựa trên miền.

Trong số 10 xu hướng công nghệ chiến lược hàng đầu của Gartner cho năm 2019 là một thứ được gọi là Nhà phát triển Augmented. Thị trường đang chuyển đổi nhanh chóng từ một trong đó các nhà khoa học dữ liệu chuyên nghiệp phải hợp tác với các nhà phát triển ứng dụng để tạo ra hầu hết các giải pháp tăng cường AI sang một trong đó các nhà phát triển chuyên nghiệp có thể hoạt động một mình bằng cách sử dụng các mô hình được xác định trước được phân phối như một dịch vụ. Điều này cung cấp cho nhà phát triển một hệ sinh thái các thuật toán và mô hình AI, cũng như các công cụ phát triển được thiết kế để tích hợp các khả năng và mô hình AI vào một giải pháp.

Hãy để tôi thảo luận về hai ví dụ về các giải pháp AI đã được cải tiến bằng cách đưa vào các mô hình được xác định trước. Các nghiên cứu đầu tiên liên quan đến dự đoán hành vi của con người, dựa trên nghiên cứu trong nhóm Động lực học của MIT do Giáo sư Media Lab Alex (Sandy) dẫn đầu, được giải thích chi tiết trong cuốn sách Vật lý xã hội năm 2014: Ý tưởng lan truyền tốt như thế nào.

Dữ liệu bắt nguồn từ hành vi của con người là năng động và luôn thay đổi. Dữ liệu lộn xộn như vậy rất khó để phân tích để đưa ra dự đoán.

Sau nhiều năm nghiên cứu, nhóm của Giáo sư Pentland đã phát hiện ra rằng tất cả dữ liệu sự kiện đại diện cho hoạt động của con người đều chứa một tập các mẫu hoạt động xã hội đặc biệt bất kể dữ liệu đó nói về cái gì. Những mô hình này là phổ biến trên tất cả các hoạt động và nhân khẩu học của con người, và có thể được sử dụng để phát hiện các xu hướng hành vi mới nổi trước khi chúng có thể được quan sát bằng bất kỳ kỹ thuật nào khác. Phát hiện các xu hướng thay đổi nhanh như vậy đòi hỏi khả năng phân tích thường xuyên các bộ dữ liệu được thu thập trong khoảng thời gian ngắn để tìm kiếm các sai lệch so với các mẫu được dự đoán bởi các mô hình hành vi của con người.

Tại sao có những mô hình hoạt động phổ quát của con người như vậy? Câu trả lời có khả năng nằm ở sự tiến hóa của loài người. Chúng tôi là một loài xã hội, với nỗ lực học hỏi từ những người khác trong nhóm xã hội của chúng tôi. Học tập xã hội như vậy đã giúp chúng ta tồn tại bằng cách thích nghi với các môi trường khác nhau mạnh mẽ, và do đó đã được củng cố bởi chọn lọc tự nhiên.

Những mô hình hành vi xã hội này đã được thử nghiệm trên nhiều ứng dụng liên quan đến con người, bao gồm xây dựng chiến lược trong kinh doanh, hoạt động kinh tế ở các thành phố và phát hiện hoạt động khủng bố tiềm năng dựa trên dữ liệu Twitter. Miễn là dữ liệu liên quan đến hoạt động của con người, các động lực hành vi tương tự được áp dụng bất kể loại dữ liệu, nhân khẩu học của người dùng hoặc kích thước của tập dữ liệu,

Ví dụ thứ hai đến từ r4 Technologies, một công ty dựa trên AI có ban cố vấn mà tôi mới tham gia. Các tổ chức dựa trên con người, như các công ty và ngành công nghiệp, thường dựa trên các yếu tố chung, quy trình và mô hình mối quan hệ, giúp có thể phát triển các mô hình khá phổ biến về cách thức hoạt động của chúng. Trong thập kỷ qua, r4 đã phát triển các mô hình chung, có thể tùy chỉnh của các tổ chức kinh doanh và các ngành công nghiệp mà họ hoạt động.

Các mô hình sau đó được tùy chỉnh cho từng công ty cụ thể bằng cách sử dụng dữ liệu nội bộ của riêng mình cũng như nhiều nguồn dữ liệu bên ngoài, do đó tạo ra một mô phỏng song sinh kỹ thuật số duy nhất của công ty và môi trường thị trường của nó, được cập nhật liên tục khi có dữ liệu mới. cho phép công ty phát hiện các xu hướng kinh doanh và thị trường mới nổi trước khi chúng có thể được phát hiện bằng các phương pháp thống kê, giúp công ty đưa ra quyết định tốt hơn, nhanh hơn.

Hãy để tôi kết luận bằng cách tóm tắt các lợi ích chính của các giải pháp AI dựa trên việc tăng cường các phương pháp thống kê với các mô hình dựa trên miền:

  • họ có thể được đào tạo hoặc tùy chỉnh với các tập dữ liệu nhỏ hơn nhiều;
  • họ có thể chịu đựng được nhiều tiếng ồn hơn trong dữ liệu;
  • chúng có thể được cập nhật liên tục với dữ liệu mới phản ánh các điều kiện thay đổi;
  • dễ dàng hơn để giải thích làm thế nào một quyết định hoặc khuyến nghị đã được đưa ra; và,
  • các giải pháp AI tăng cường như vậy giúp nắm bắt các mối quan hệ nguyên nhân và kết quả.

Irving Wladawsky-Berger đã làm việc tại IBM trong 37 năm và là cố vấn chiến lược cho Citigroup, HBO và Mastercard. Ông liên kết với MIT và Imperial College, và là người đóng góp thường xuyên cho Tạp chí CIO.

Có thể bạn quan tâm