AI+Web3: Dữ liệu, Khả năng tính toán và mô hình của cuộc cách mạng Phi tập trung

AI+Web3: Tòa tháp và Quảng trường

TL;DR

  1. Dự án Web3 với khái niệm AI trở thành mục tiêu hút tiền trong thị trường sơ cấp và thứ cấp.

  2. Cơ hội của Web3 trong ngành AI thể hiện ở: sử dụng các động lực phân phối để phối hợp cung tiềm năng trong đuôi dài ( qua dữ liệu, lưu trữ và tính toán ), đồng thời xây dựng mô hình mã nguồn mở và thị trường phi tập trung cho AI Agent.

  3. AI chủ yếu được sử dụng trong ngành Web3 cho tài chính trên chuỗi ( thanh toán tiền điện tử, giao dịch, phân tích dữ liệu ) và hỗ trợ phát triển.

  4. Tính hữu ích của AI+Web3 được thể hiện qua sự bổ sung lẫn nhau của cả hai: Web3 có khả năng chống lại sự tập trung của AI, trong khi AI có khả năng giúp Web3 vượt qua rào cản.

AI+Web3: Tháp và Quảng trường

Giới thiệu

Trong hai năm qua, sự phát triển của AI giống như đã nhấn nút tăng tốc, làn sóng do Chatgpt khởi xướng không chỉ mở ra một kỷ nguyên mới của trí tuệ nhân tạo sinh sinh mà còn tạo ra sóng lớn trong lĩnh vực Web3.

Dưới sự hỗ trợ của khái niệm AI, việc huy động vốn cho thị trường tiền điện tử đang chậm lại có sự cải thiện rõ rệt. Theo thống kê, chỉ trong nửa đầu năm 2024 đã có 64 dự án Web3+AI hoàn thành huy động vốn, trong đó hệ điều hành dựa trên trí tuệ nhân tạo Zyber365 đã huy động được 100 triệu USD trong vòng gọi vốn Series A, lập kỷ lục cao nhất.

Thị trường thứ cấp ngày càng sôi động, trang web tổng hợp tiền điện tử Coingecko cho thấy, chỉ trong hơn một năm, tổng giá trị thị trường của lĩnh vực AI đã đạt 48,5 tỷ USD, khối lượng giao dịch trong 24 giờ gần 8,6 tỷ USD; những tiến bộ công nghệ AI chính thống mang lại lợi ích rõ rệt, sau khi OpenAI phát hành mô hình chuyển đổi văn bản thành video Sora, giá trung bình của lĩnh vực AI đã tăng 151%; hiệu ứng AI cũng lan tỏa đến một trong những lĩnh vực thu hút tiền điện tử: Meme: MemeCoin đầu tiên với khái niệm AI Agent - GOAT nhanh chóng nổi tiếng và đạt giá trị 1,4 tỷ USD, thành công trong việc khơi dậy cơn sốt AI Meme.

Về nghiên cứu và chủ đề AI+Web3 cũng đang rất sôi nổi, từ AI+Depin đến AI Memecoin và hiện tại là AI Agent và AI DAO, cảm xúc FOMO đã không thể theo kịp tốc độ xoay chuyển của các câu chuyện mới.

Cụm từ AI+Web3 đầy tiền nóng, cơ hội và ảo tưởng về tương lai này, khó tránh khỏi bị coi như một cuộc hôn nhân do vốn đầu tư sắp đặt, chúng ta rất khó để phân biệt rằng dưới lớp vỏ hào nhoáng này, liệu đây có phải là sân khấu của những kẻ đầu cơ hay là đêm trước của sự bùng nổ?

Để trả lời câu hỏi này, một suy nghĩ quan trọng đối với cả hai bên là, liệu có sự hiện diện của nhau sẽ khiến mọi thứ tốt hơn không? Liệu có thể hưởng lợi từ mô hình của nhau không? Bài viết này cố gắng đứng trên vai những người đi trước để xem xét cấu trúc này: Web3 có thể phát huy vai trò gì trong các bước của công nghệ AI, và AI có thể mang lại sinh khí mới cho Web3 như thế nào?

Cơ hội nào cho Web3 dưới AI Stack?

Trước khi mở rộng chủ đề này, chúng ta cần hiểu về công nghệ của mô hình AI lớn:

Mô hình lớn giống như bộ não con người, ban đầu như một đứa trẻ mới sinh, cần quan sát và hấp thụ một khối lượng thông tin khổng lồ từ bên ngoài để hiểu thế giới, đây là giai đoạn "thu thập" dữ liệu; vì máy tính không có nhiều giác quan như con người, trước khi đào tạo cần phải "tiền xử lý" để chuyển đổi thông tin không được gán nhãn thành định dạng mà máy tính có thể hiểu.

Sau khi nhập dữ liệu, AI thông qua "huấn luyện" xây dựng một mô hình có khả năng hiểu và dự đoán, giống như quá trình trẻ em dần dần hiểu và học hỏi từ thế giới xung quanh. Các tham số của mô hình giống như khả năng ngôn ngữ của trẻ em được điều chỉnh liên tục. Nội dung học tập được phân chia theo chuyên ngành hoặc giao tiếp với con người để nhận phản hồi và điều chỉnh, bước vào giai đoạn "tinh chỉnh".

Khi trẻ em lớn lên và biết nói, chúng có thể hiểu ý nghĩa và diễn đạt suy nghĩ trong các cuộc đối thoại mới, tương tự như "suy diễn" của mô hình AI lớn, có khả năng dự đoán và phân tích đầu vào văn bản ngôn ngữ mới. Trẻ sơ sinh thể hiện cảm xúc, mô tả đối tượng và giải quyết vấn đề thông qua ngôn ngữ, giống như các mô hình AI lớn được áp dụng vào các nhiệm vụ cụ thể trong giai đoạn suy diễn sau khi hoàn thành quá trình huấn luyện, như phân loại hình ảnh, nhận diện giọng nói, v.v.

AI Agent thì gần gũi hơn với hình thái tiếp theo của mô hình lớn - có khả năng thực hiện nhiệm vụ độc lập và theo đuổi mục tiêu phức tạp, không chỉ có khả năng tư duy, mà còn có thể ghi nhớ, lập kế hoạch và sử dụng công cụ để tương tác với thế giới.

Hiện nay, để giải quyết các điểm đau của AI, Web3 đã hình thành một hệ sinh thái đa tầng, kết nối lẫn nhau, bao gồm tất cả các giai đoạn của quy trình mô hình AI.

AI+Web3:Tháp và Quảng Trường

Cơ sở hạ tầng: Airbnb về sức mạnh tính toán và dữ liệu

sức mạnh tính toán

Hiện tại, một trong những chi phí cao nhất của AI là sức mạnh tính toán và năng lượng cần thiết cho việc huấn luyện và suy luận mô hình.

Ví dụ, LLAMA3 của Meta cần 16.000 GPU NVIDIA H100 trong 30 ngày để hoàn thành việc huấn luyện. Phiên bản H100 80GB có giá từ 30.000 đến 40.000 đô la Mỹ, điều này cần một khoản đầu tư phần cứng tính toán từ 400 triệu đến 700 triệu đô la Mỹ ( GPU + chip mạng ), tiêu thụ 1,6 tỷ kilowatt giờ mỗi tháng, chi phí năng lượng gần 20 triệu đô la Mỹ.

Giải nén sức mạnh AI cũng là lĩnh vực giao thoa sớm nhất giữa Web3 và AI - DePin( mạng lưới cơ sở hạ tầng vật lý phi tập trung). Hiện tại, trang web dữ liệu DePin Ninja đã liệt kê hơn 1400 dự án, trong đó các dự án đại diện cho việc chia sẻ sức mạnh GPU bao gồm io.net, Aethir, Akash, Render Network và nhiều dự án khác.

Logic chính là: nền tảng cho phép những người sở hữu tài nguyên GPU không sử dụng đóng góp sức mạnh tính toán theo cách phi tập trung không cần giấy phép, thông qua một thị trường trực tuyến giữa người mua và người bán tương tự như Uber hoặc Airbnb, nâng cao tỷ lệ sử dụng tài nguyên GPU chưa được khai thác; người dùng cuối nhận được tài nguyên tính toán hiệu quả với chi phí thấp hơn; đồng thời, cơ chế staking đảm bảo rằng những nhà cung cấp tài nguyên sẽ bị trừng phạt nếu vi phạm cơ chế kiểm soát chất lượng hoặc ngắt kết nối mạng.

Các đặc điểm bao gồm:

  • Tập hợp tài nguyên GPU nhàn rỗi: Các nhà cung cấp chủ yếu là các trung tâm dữ liệu độc lập, nhỏ và vừa bên thứ ba, các nhà điều hành mỏ tiền mã hóa, v.v., có tài nguyên tính toán dư thừa, với cơ chế đồng thuận là phần cứng đào PoS, như máy đào FileCoin và ETH. Một số dự án đang nỗ lực giảm bớt rào cản khởi động, chẳng hạn như exolab sử dụng các thiết bị địa phương như MacBook, iPhone, iPad để xây dựng mạng lưới tính toán cho suy diễn mô hình lớn.

  • Hướng tới thị trường AI tính toán dài đuôi: a. Phía kỹ thuật: Thị trường sức mạnh tính toán phi tập trung phù hợp hơn với các bước suy luận. Huấn luyện phụ thuộc nhiều vào khả năng xử lý dữ liệu của GPU với quy mô siêu lớn, trong khi suy luận lại yêu cầu hiệu suất tính toán của GPU tương đối thấp, như Aethir tập trung vào công việc kết xuất độ trễ thấp và ứng dụng suy luận AI. b. Bên cầu: Các bên có nhu cầu tính toán nhỏ sẽ không tự đào tạo mô hình lớn của riêng họ, mà chọn tối ưu hóa và tinh chỉnh xung quanh một số mô hình lớn hàng đầu, những tình huống này tự nhiên phù hợp với nguồn tài nguyên tính toán nhàn rỗi phân tán.

  • Quyền sở hữu phi tập trung: Ý nghĩa của công nghệ blockchain là chủ sở hữu tài nguyên luôn giữ quyền kiểm soát đối với tài nguyên, có thể điều chỉnh linh hoạt theo nhu cầu và thu được lợi nhuận.

Dữ liệu

Dữ liệu là nền tảng của AI. Không có dữ liệu, tính toán giống như cỏ dại, hoàn toàn vô dụng, và mối quan hệ giữa dữ liệu và mô hình giống như câu ngạn ngữ "Garbage in, Garbage out", số lượng dữ liệu và chất lượng đầu vào quyết định chất lượng đầu ra cuối cùng của mô hình. Đối với việc đào tạo mô hình AI hiện tại, dữ liệu quyết định khả năng ngôn ngữ, khả năng hiểu biết, thậm chí cả giá trị và biểu hiện nhân văn của mô hình. Hiện tại, khó khăn về nhu cầu dữ liệu của AI chủ yếu thể hiện ở:

  • Sự khát dữ liệu: Huấn luyện mô hình AI phụ thuộc vào việc nhập dữ liệu khổng lồ. Theo thông tin, số lượng tham số của OpenAI huấn luyện GPT-4 đạt đến cấp độ ngàn tỷ.

  • Chất lượng dữ liệu: Khi AI kết hợp với các ngành, tính kịp thời, tính đa dạng, tính chuyên môn của dữ liệu theo ngách và việc thu thập nguồn dữ liệu mới như cảm xúc trên mạng xã hội đã đặt ra yêu cầu mới về chất lượng.

  • Vấn đề về quyền riêng tư và tuân thủ: Các quốc gia và doanh nghiệp đang dần nhận thức được tầm quan trọng của bộ dữ liệu chất lượng, đang hạn chế việc thu thập dữ liệu.

  • Chi phí xử lý dữ liệu cao: Khối lượng dữ liệu lớn, quy trình xử lý phức tạp. Theo thông tin, các công ty AI dành trên 30% chi phí nghiên cứu và phát triển cho việc thu thập và xử lý dữ liệu cơ bản.

Hiện tại, các giải pháp Web3 được thể hiện ở:

  1. Thu thập dữ liệu: Dữ liệu thế giới thực có sẵn miễn phí đang nhanh chóng cạn kiệt, chi tiêu của các công ty AI cho dữ liệu đang tăng lên hàng năm. Tuy nhiên, chi tiêu này không được tái đầu tư cho những người đóng góp dữ liệu thực sự, các nền tảng độc quyền giá trị tạo ra từ dữ liệu, như Reddit đã đạt được doanh thu 203 triệu USD thông qua việc ký kết thỏa thuận cấp phép dữ liệu với các công ty AI.

Cho phép người dùng thực sự đóng góp vào việc tạo ra giá trị dữ liệu và thông qua mạng lưới phân tán cùng với cơ chế khuyến khích để có được dữ liệu riêng tư và có giá trị hơn của người dùng với chi phí thấp, là tầm nhìn của Web3.

  • Grass là lớp dữ liệu và mạng phi tập trung, người dùng có thể chạy nút Grass, đóng góp băng thông nhàn rỗi và lưu lượng trung gian để thu thập dữ liệu thời gian thực từ toàn bộ internet, và nhận phần thưởng bằng token.

  • Vana giới thiệu khái niệm độc đáo về hồ chứa thanh khoản dữ liệu (DLP), người dùng có thể tải lên dữ liệu cá nhân ( như lịch sử mua sắm, thói quen duyệt web, hoạt động trên mạng xã hội, v.v. ) vào DLP cụ thể và linh hoạt chọn xem có cho phép bên thứ ba cụ thể sử dụng hay không.

  • Trong PublicAI, người dùng có thể sử dụng #AI或# thẻ Web3 trên X và @PublicAI để thực hiện thu thập dữ liệu.

  1. Xử lý dữ liệu: Trong quá trình xử lý dữ liệu AI, do dữ liệu thu thập thường bị nhiễu và chứa lỗi, cần phải làm sạch và chuyển đổi sang định dạng có thể sử dụng trước khi huấn luyện mô hình, liên quan đến các nhiệm vụ tiêu chuẩn hóa, lọc và xử lý giá trị thiếu. Giai đoạn này là một trong số ít các bước có sự can thiệp của con người trong ngành AI, dẫn đến sự ra đời của ngành đánh dấu dữ liệu, khi yêu cầu về chất lượng dữ liệu của mô hình ngày càng cao, tiêu chuẩn cho các nhà đánh dấu dữ liệu cũng tăng lên, nhiệm vụ này tự nhiên phù hợp với cơ chế khuyến khích phi tập trung của Web3.
  • Grass và OpenLayer đang xem xét việc thêm vào giai đoạn quan trọng này là ghi nhãn dữ liệu.

  • Synesis đã đưa ra khái niệm "Train2earn", nhấn mạnh vào chất lượng dữ liệu, người dùng có thể nhận được phần thưởng bằng cách cung cấp dữ liệu được gán nhãn, chú thích hoặc các đầu vào khác.

  • Dự án gán nhãn dữ liệu Sapien đã biến các nhiệm vụ gán nhãn thành trò chơi và cho phép người dùng đặt cọc điểm để kiếm thêm điểm.

  1. Quyền riêng tư và an ninh dữ liệu: cần làm rõ quyền riêng tư dữ liệu và an ninh dữ liệu là hai khái niệm khác nhau. Quyền riêng tư dữ liệu liên quan đến việc xử lý dữ liệu nhạy cảm, trong khi an ninh dữ liệu bảo vệ thông tin dữ liệu khỏi việc truy cập, phá hoại và đánh cắp trái phép. Do đó, lợi thế công nghệ quyền riêng tư Web3 và các ứng dụng tiềm năng được thể hiện qua: (1) đào tạo dữ liệu nhạy cảm; (2) hợp tác dữ liệu: nhiều chủ sở hữu dữ liệu có thể cùng tham gia đào tạo AI mà không cần chia sẻ dữ liệu gốc.

Các công nghệ quyền riêng tư phổ biến trong Web3 hiện tại bao gồm:

  • Môi trường thực thi đáng tin cậy ( TEE ), như Super Protocol;

  • Mã hóa đồng nhất hoàn toàn ( FHE ), như BasedAI, Fhenix.io hoặc Inco Network;

  • Công nghệ bằng chứng không kiến thức ( zk ), như giao thức Reclaim sử dụng công nghệ zkTLS, tạo ra bằng chứng không kiến thức cho lưu lượng HTTPS, cho phép người dùng nhập dữ liệu hoạt động, danh tiếng và danh tính từ các trang web bên ngoài một cách an toàn mà không cần tiết lộ thông tin nhạy cảm.

Tuy nhiên, lĩnh vực này vẫn đang ở giai đoạn đầu, hầu hết các dự án vẫn đang trong quá trình khám phá, hiện tại khó khăn là chi phí tính toán quá cao, ví dụ:

  • Khung zkML EZKL cần khoảng 80 phút để tạo ra chứng minh cho mô hình 1M-nanoGPT.

  • Theo dữ liệu của Modulus Labs, chi phí zkML cao hơn tính toán thuần túy hơn 1000 lần.

  1. Lưu trữ dữ liệu: Sau khi có dữ liệu, cần lưu trữ dữ liệu trên chuỗi và LLM được tạo ra từ dữ liệu đó. Với vấn đề khả dụng của dữ liệu (DA) làm trọng tâm, trước khi nâng cấp Danksharding trên Ethereum, thông lượng của nó chỉ đạt 0,08MB. Trong khi đó, việc đào tạo mô hình AI và suy diễn thời gian thực thường cần từ 50-100GB thông lượng dữ liệu mỗi giây. Sự khác biệt về quy mô này khiến các giải pháp trên chuỗi hiện tại không thể đáp ứng khi đối mặt với "các ứng dụng AI tiêu tốn tài nguyên."
  • 0g.AI là một dự án tiêu biểu trong loại này. Nó là giải pháp lưu trữ tập trung được thiết kế cho nhu cầu hiệu suất cao của AI, với các đặc điểm chính bao gồm: hiệu suất cao và khả năng mở rộng, hỗ trợ tải lên và tải xuống nhanh chóng các bộ dữ liệu lớn thông qua công nghệ phân mảnh cao cấp (Sharding) và mã sửa lỗi (Erasure Coding), tốc độ truyền dữ liệu gần 5GB mỗi giây.

Middleware: Huấn luyện và suy diễn mô hình

Thị trường phi tập trung mô hình mã nguồn mở

Cuộc tranh luận về việc mô hình AI nên đóng hay mở nguồn chưa bao giờ ngừng lại. Sự đổi mới tập thể mà mã nguồn mở mang lại là lợi thế mà các mô hình đóng không thể sánh kịp, tuy nhiên trong điều kiện không có mô hình lợi nhuận, làm thế nào để mô hình mở có thể tăng cường động lực cho các nhà phát triển? Đây là một hướng đi đáng suy ngẫm, người sáng lập Baidu, Lý Ngạn Hồng, đã từng khẳng định vào tháng 4 năm nay, "mô hình mở sẽ ngày càng tụt lại phía sau."

Đối với điều này, Web3 đã đề xuất khả năng của một thị trường mô hình mã nguồn mở phi tập trung, tức là token hóa chính mô hình, giữ lại một tỷ lệ token nhất định cho đội ngũ, và chuyển một phần doanh thu tương lai của mô hình cho những người nắm giữ token.

  • Giao thức Bittensor thiết lập một thị trường P2P cho các mô hình mã nguồn mở, bao gồm hàng chục "mạng con", nơi các nhà cung cấp tài nguyên ( tính toán, thu thập/lưu trữ dữ liệu, và nhân sự học máy ) cạnh tranh lẫn nhau để đáp ứng mục tiêu của các chủ sở hữu mạng con cụ thể. Các mạng con có thể tương tác và học hỏi lẫn nhau, tạo ra trí tuệ mạnh mẽ hơn. Phần thưởng được phân phối thông qua bỏ phiếu cộng đồng, và được phân bổ thêm trong các mạng con dựa trên hiệu suất cạnh tranh.

  • ORA giới thiệu khái niệm phát hành mô hình ban đầu (IMO), biến AI thành token, có thể được mua, bán và phát triển mô hình AI thông qua mạng phi tập trung.

  • Sentient, một đi trung

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
DAOplomacyvip
· 08-10 07:18
lại một câu chuyện web3 x ai nữa... thật lòng mà nói, tôi đã xem bộ phim này trước đây.
Xem bản gốcTrả lời0
SerLiquidatedvip
· 08-10 07:17
Lại vẽ BTC nữa rồi
Xem bản gốcTrả lời0
ReverseTradingGuruvip
· 08-10 07:05
Lại có thể thu tiền rồi sao
Xem bản gốcTrả lời0
DegenMcsleeplessvip
· 08-10 07:03
chơi đùa với mọi người một chút ai có phải là ý này không...
Xem bản gốcTrả lời0
staking_grampsvip
· 08-10 06:57
Vẫn còn đang đồn thổi về độ nóng của AI sao?? Chán quá
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)