AI Data for Research

Nghiên cứu và khai thác dữ liệu huấn luyện chất lượng cho cộng đồng nghiên cứu và phát triển AI.

Chúng tôi là OpenData

Tổ chức phi lợi nhuận thúc đẩy AI thông qua cung cấp dữ liệu huấn luyện chất lượng, tạo điều kiện cho các tổ chức, nhóm nghiên cứu có tài nguyên cần thiết để nghiên cứu, phát triển, và ứng dụng AI.

3+

200+

Nhân sự

Dự Án

Tham gia

AI Training Data

Chúng tôi khai thác và cung cấp dữ liệu huấn luyện các hệ thống AI

Khai thác Dữ liệu

Dữ liệu thô thu thập từ nhiều nguồn sẽ được xử lý, trích xuất để tạo ra nhưng bộ dataset có ý nghĩa, giàu thông tin giúp tăng cường hiệu năng các mô hình AI.

Hệ thống "đào" dữ liệu

OpenData cung cấp hệ thống khai thác dữ liệu dành với mục tiêu dễ tiếp cận với nhiều đối tượng từ nhiều linh vực, thu hút nguồn lực xã hội, tăng tốc việc phát triển AI.

Chúng tôi cam kết các dữ án sẽ được công bố dưới hình thức mã nguồn mở và phi thương mại với mục tiêu chính là giúp các tổ chức, nhóm nghiên cứu vượt qua giới hạn về dữ liệu để xây dựng các hệ thống AI mạnh mẽ hơn.

Sứ mệnh vì cộng đồng

Dự án dữ liệu AI

Danh sách các dự án đang phát triển

Vietnamese Image Captioning

Thu thập dữ liệu ảnh và captions có thể sử dụng cho các mô hình sinh ảnh, miêu tả ảnh, hỏi đáp hình ảnh, ...

Vietnamese Text Embedding

Dữ liệu cặp văn bản tiêng việt để huấn luyện các mô hình text embedding cho general domain.

Natural text-speech dataset

Thu thập giọng đọc cho các hệ thống speech-to-text and text-to-speech

Onoging

...

→

Dữ liệu huấn luyện AI là tài nguyên quy giá và thường ít được chia sẻ, gây trở ngại lớn trong việc phát triển AI công bằng và có trách nhiệm. OpenData là dự án phi lợi nhuận đầu tiên hướng tới việc khai thác dữ liệu huấn luyện AI quy mô lớn.Dữ liệu được công khai, miễn phí sẽ là chất xúc tác đẩy nhanh tốc độ nghiên cứu và phát triển AI.

OpenData Team

★★★★★

Dữ liệu

Thúc đẩy AI qua dữ liệu huấn luyện chất lượng.

Cộng đồng

Phát triển

contact@opendata.org

+84123456789