Giới khoa học đau đầu khi “cạn dữ liệu” huấn luyện AI

Thanh Tùng/TTXVN
09:04' - 13/12/2024

BNEWS Khi nguồn dữ liệu Internet sắp cạn kiệt, ngành công nghiệp AI đang đứng trước một thách thức lớn.

Biểu tượng của OpenAI và ChatGPT. Ảnh: AFP/TTXVN

Các chuyên gia dự báo đến năm 2028, lượng dữ liệu cần thiết để huấn luyện các mô hình ngôn ngữ lớn (LLM) sẽ ngang bằng với toàn bộ kho dữ liệu văn bản công khai trên Internet.

Theo nghiên cứu của Viện Epoch AI, quy mô tập dữ liệu huấn luyện AI đang tăng gấp đôi mỗi năm, trong khi lượng nội dung Internet chỉ tăng chưa đến 10% hàng năm. Shayne Longpre, nhà nghiên cứu AI tại Viện Công nghệ Massachusetts (MIT), cho rằng tình trạng thiếu hụt dữ liệu đã bắt đầu xuất hiện.

Thêm vào đó, các nhà xuất bản và chủ sở hữu nội dung đang siết chặt quyền kiểm soát việc sử dụng dữ liệu của họ. Nhiều vụ kiện đã được đệ trình, trong đó có vụ The New York Times kiện OpenAI và Microsoft về vi phạm bản quyền vào tháng 12/2023.

Tuy nhiên, các công ty AI lớn như OpenAI và Anthropic đang tìm nhiều giải pháp thay thế. Họ đang khai thác các nguồn dữ liệu phi truyền thống và thậm chí tự tạo ra dữ liệu mới. OpenAI cho biết họ đang tạo ra 100 tỷ từ mỗi ngày, tương đương với khoảng 36 nghìn tỷ từ một năm.

Một hướng đi khác là phát triển các mô hình AI nhỏ hơn, chuyên biệt cho từng nhiệm vụ cụ thể. Các mô hình này cần ít dữ liệu hơn nhưng đòi hỏi kỹ thuật huấn luyện tinh vi hơn. Theo một nghiên cứu năm 2024, nhờ cải tiến thuật toán, sức mạnh tính toán cần thiết để đạt cùng hiệu suất đã giảm một nửa sau mỗi 8 tháng.

Yann LeCun, Giám đốc khoa học AI tại Meta, đề xuất hướng tiếp cận mới: học từ dữ liệu đa dạng hơn như video và hình ảnh. Ông chỉ ra rằng một đứa trẻ 4 tuổi đã tiếp nhận lượng thông tin gấp 50 lần so với dữ liệu huấn luyện của một mô hình LLM hiện đại, chỉ thông qua việc quan sát thế giới xung quanh.

Andy Zou, nghiên cứu sinh tại Đại học Carnegie Mellon, lạc quan cho rằng các mô hình AI, sau khi đã đọc phần lớn Internet, có thể không cần thêm dữ liệu để trở nên thông minh hơn. Thay vào đó, khả năng tự học và tự suy ngẫm của AI có thể là chìa khóa cho những tiến bộ trong tương lai.

Thanh Tùng/TTXVN

Tin cùng chuyên mục

Công nghệ
Trung Quốc ứng dụng công nghệ hỗ trợ hoạt động cứu hộ thiên tai
07:30' - 12/07/2026
Các công nghệ được triển khai trong nỗ lực chống lũ lụt không chỉ cho thấy hiệu quả thực tiễn mà còn khẳng định tiềm năng phục vụ cộng đồng của khoa học - công nghệ.
Công nghệ
Đột phá trong sử dụng nhiên liệu mới cho tên lửa đẩy
20:30' - 11/07/2026
Nhiên liệu này cung cấp một lộ trình công nghệ hiệu quả về kinh tế và ít phát thải carbon cho sự phát triển chất lượng cao của ngành công nghiệp vũ trụ thương mại.
Công nghệ
"Cánh tay" nối dài của chính quyền số
13:00' - 11/07/2026
Với phương châm “đi từng ngõ, gõ từng nhà, hướng dẫn từng người”, các tổ công nghệ số cộng đồng đóng vai trò nòng cốt hướng dẫn người dân những kỹ năng cơ bản về chuyển đổi số.
Công nghệ
Chuyển đổi số và kích cầu du lịch để thúc đẩy tăng trưởng hai con số
07:30' - 11/07/2026
Năm 2026, tỉnh Đắk Lắk phấn đấu đón 8 triệu lượt khách đến tham quan, du lịch tại tỉnh, trong đó khách quốc tế đạt 130.000 lượt; doanh thu từ du lịch phấn đấu đạt 16 tỷ đồng.
Công nghệ
Trung Quốc phóng thành công tên lửa đẩy Trường Chinh-10B, lần đầu thu hồi tầng đẩy
17:29' - 10/07/2026
Trung Quốc phóng thành công tên lửa Trường Chinh-10B và lần đầu tiên thu hồi có kiểm soát tầng đẩy thứ nhất, đánh dấu bước tiến quan trọng trong công nghệ tên lửa tái sử dụng.
Công nghệ
Waymo chuẩn bị cung cấp dịch vụ xe tự lái ở 4 thành phố của Mỹ
13:00' - 10/07/2026
Công ty dịch vụ xe tự lái Waymo ngày 8/7 cho biết sẽ bắt đầu cung cấp dịch vụ xe tự lái tại bốn thành phố của Mỹ bao gồm San Diego, Las Vegas, Tampa, Florida và Denver.
Công nghệ
Giải pháp then chốt trong chăn nuôi tuần hoàn
09:30' - 10/07/2026
Trong bối cảnh chịu áp lực phải giảm phát thải khí nhà kính và kiểm soát ô nhiễm môi trường, nhiều trang trại chăn nuôi đã ứng dụng hệ thống tách phân tự động nhằm xử lý chất thải hiệu quả hơn.
Công nghệ
Meta ra mắt mô hình AI Muse Spark 1.1 với bản xem trước dành cho nhà phát triển
07:34' - 10/07/2026
Mô hình AI mới nhất của Meta có khả năng viết code, gỡ lỗi và tự động hóa tác vụ phức tạp, với mức phí cạnh tranh nhằm thu hút nhà phát triển rời bỏ Anthropic và OpenAI.
Công nghệ
Số hóa di sản làng quê gắn với phát triển du lịch
07:30' - 10/07/2026
Dự án số hóa Di tích chùa Keo Hành Thiện được triển khai từ năm 2023, hướng tới xây dựng hệ thống cơ sở dữ liệu số toàn diện về lịch sử, văn hóa, kiến trúc và các giá trị di sản.

Tin nổi bật

Điểm báo trong tuần

Loạt ‘ông lớn’ Hàn Quốc xây thêm nhà máy tại Việt Nam

Nhà máy linh kiện điện thoại Dowoo Insys mới đây đã chính thức khởi công xây dựng nhà máy sản xuất thứ hai tại Việt Nam nhằm mở rộng năng lực cung ứng kính siêu mỏng (UTG – Ultra Thin Glass), đón đầu làn sóng tăng trưởng của thị trường thiết bị màn hình gập.
Theo vnexpress.net
Ra mắt tháp văn phòng IFC Hanoi tại Tây Hồ Tây

Tòa văn phòng IFC Hanoi mới ra mắt có quy mô 83.000 m2, thuộc tổ hợp đa chức năng gồm văn phòng hạng A, thương mại bán lẻ, khách sạn 5 sao và căn hộ dịch vụ.
Theo vnexpress.net
Sun Group đưa mô hình chợ đêm VUI-Fest đến Nha Trang

Sau Cát Bà, Hạ Long và Phú Quốc, Sun Group tiếp tục phát triển chợ đêm VUI-Fest tại Festival Island (Charmora City) kết hợp phố đi bộ và tuyến ẩm thực hoạt động 24/7.
Theo vnexpress.net
MIK Group phát triển chuỗi khu đô thị thương hiệu Forestia

MIK Group ra mắt thương hiệu khu đô thị Forestia ngày 10/7, định hướng phát triển chuỗi đô thị tích hợp tại nhiều địa phương như Hà Nội, Hưng Yên…
Theo markettimes.vn
BAF đề xuất xây chung cư nuôi lợn hơn 200ha tại tỉnh Hưng Yên

Tại buổi làm việc, đại diện Công ty Cổ phần Nông nghiệp BAF Việt Nam cho biết, doanh nghiệp mong muốn đầu tư mô hình chăn nuôi lợn trong nhà cao tầng kết hợp phát triển nông nghiệp tuần hoàn với quy mô khoảng 220 - 250ha.
Theo baodautu.vn
IMG Phước Đông bắt tay đối tác Đức triển khai dự án thép xanh 3,1 tỷ USD

Làn sóng đầu tư xanh từ châu Âu đang mở ra nhiều cơ hội mới cho ngành công nghiệp Việt Nam. Trong bối cảnh đó, IMG Phước Đông và VFT Bio Fuels UG (Đức) đã ký Biên bản ghi nhớ (MOU) nhằm nghiên cứu, thúc đẩy triển khai tổ hợp thép xanh quy mô khoảng 3,1 tỷ USD tại Khu công nghiệp Tân Lân 3.
Theo baodautu.vn
Nhà bán lẻ hàng đầu Ấn Độ sắp sang Việt Nam tìm nhà cung ứng

Reliance Retail - hệ thống bán lẻ lớn nhất Ấn Độ với mạng lưới hàng chục nghìn cửa hàng cùng nền tảng bán lẻ đa kênh sẽ tham gia Viet Nam International Sourcing 2026 (VIS 2026) nhằm tìm kiếm các nhà cung ứng ổn định, lâu dài.
Theo vnexpress.net
Cửa hàng DJI Authorized Retail đầu tiên khai trương tại Việt Nam

Cửa hàng ủy quyền chính hãng của DJI tại Việt Nam mang mô hình trải nghiệm trực tiếp, tư vấn và hậu mãi theo tiêu chuẩn toàn cầu đến người dùng Việt.
Theo vnexpress.net
Sunhouse đầu tư 2.000 tỷ đồng cho nhà máy robot tự hành và thiết bị AI

Nhà máy Robot tự hành và Thiết bị AI của Sunhouse tại Hòa Lạc, quy mô hơn 130.000 m2 hiện thực hóa mục tiêu phổ thông hóa gia dụng thông minh cho gia đình Việt.
Theo baodautu.vn
Trungnam Power đầu tư nhà máy điện mặt trời nổi trên hồ thủy điện Đồng Nai 2

Thông tin từ Trungnam Group, UBND tỉnh Lâm Đồng đã ban hành Quyết định số 3291/QĐ-UBND chấp thuận chủ trương đầu tư, đồng thời chấp thuận Công ty cổ phần Thủy điện Trung Nam (Trungnam Power) – đơn vị thành viên của Tập đoàn Trungnam – là nhà đầu tư thực hiện Dự án Nhà máy điện mặt trời nổi trên hồ thủy điện Đồng Nai 2.

Tin mới

Giới khoa học đau đầu khi “cạn dữ liệu” huấn luyện AI

Tin liên quan

"Cha đẻ của AI" cũng lo ngại về những rủi ro từ trí tuệ nhân tạo

Nghiên cứu đưa ứng dụng trí tuệ nhân tạo và dữ liệu lớn vào thị trường chứng khoán

Ứng dụng trí tuệ nhân tạo trong giảng dạy và quản lý giáo dục

Tin cùng chuyên mục

Trung Quốc ứng dụng công nghệ hỗ trợ hoạt động cứu hộ thiên tai

Đột phá trong sử dụng nhiên liệu mới cho tên lửa đẩy

"Cánh tay" nối dài của chính quyền số

Chuyển đổi số và kích cầu du lịch để thúc đẩy tăng trưởng hai con số

Trung Quốc phóng thành công tên lửa đẩy Trường Chinh-10B, lần đầu thu hồi tầng đẩy

Waymo chuẩn bị cung cấp dịch vụ xe tự lái ở 4 thành phố của Mỹ

Giải pháp then chốt trong chăn nuôi tuần hoàn

Meta ra mắt mô hình AI Muse Spark 1.1 với bản xem trước dành cho nhà phát triển

Số hóa di sản làng quê gắn với phát triển du lịch

Không quyết tâm cao, nỗ lực lớn, sẽ không có đột phá

TP. HCM mở rộng không gian, tạo sức bật mới cho du lịch

Làm gì trong "60 giây vàng" khi ca nô, tàu du lịch bị lật?

Đi canô, tàu du lịch trên biển: Những kỹ năng có thể cứu bạn trong tình huống khẩn cấp

Lật cano du lịch chở hơn 30 khách ở Phú Quốc

Loạt ‘ông lớn’ Hàn Quốc xây thêm nhà máy tại Việt Nam

Ra mắt tháp văn phòng IFC Hanoi tại Tây Hồ Tây

Sun Group đưa mô hình chợ đêm VUI-Fest đến Nha Trang

MIK Group phát triển chuỗi khu đô thị thương hiệu Forestia

BAF đề xuất xây chung cư nuôi lợn hơn 200ha tại tỉnh Hưng Yên

IMG Phước Đông bắt tay đối tác Đức triển khai dự án thép xanh 3,1 tỷ USD

Nhà bán lẻ hàng đầu Ấn Độ sắp sang Việt Nam tìm nhà cung ứng

Cửa hàng DJI Authorized Retail đầu tiên khai trương tại Việt Nam

Sunhouse đầu tư 2.000 tỷ đồng cho nhà máy robot tự hành và thiết bị AI

Trungnam Power đầu tư nhà máy điện mặt trời nổi trên hồ thủy điện Đồng Nai 2