Bảng C – Innovator

AI Agent, Docker và leaderboard

Bảng C dành cho cá nhân/đội thi tập trung vào AI Agent, Docker, private test và leaderboard kỹ thuật.

Cá nhân/đội thi thiết kế AI Agent xử lý đa tác vụ, nộp DockerHub/Github và cạnh tranh trên leaderboard.

Vòng 1

  • 11–24/5/2026: đăng ký và thi vòng 1.
  • Nộp DockerHub, Github và tài liệu phương pháp.
  • Xem kết quả trực tiếp trên leaderboard.

Vòng 2

  • Ngày 24/5/2026 nộp Docker cuối cùng.
  • 24/5–03/6/2026: BTC đánh giá private test 2000 câu.
  • Tiêu chí: Accuracy, inference, ý tưởng.

Vòng 3

  • Dự kiến 12/6/2026.
  • Trình bày trực tuyến tối đa 08 phút.
  • Live-demo và trả lời câu hỏi.

Thể lệ chi tiết

Thể lệ Bảng C – Innovator

Tải file thể lệ

Vòng 1 — Đăng ký và submission leaderboard

  • Thời gian: 11–24/5/2026.
  • Hình thức: cá nhân/đội thi đăng ký tài khoản, đăng ký dự thi và nộp submission qua website cuộc thi.
  • Nội dung: sử dụng mô hình ngôn ngữ lớn để thiết kế AI Agent xử lý đa tác vụ.
  • Kết quả: cá nhân/đội thi xem trực tiếp kết quả trên leaderboard.
  • Lưu ý: trong vòng 72 giờ kể từ khi kết thúc Vòng 1, đội thi phải gửi đầy đủ tài liệu theo mục yêu cầu đầu ra. Đội không gửi đúng thời hạn sẽ bị loại khỏi cuộc thi.

Mô hình có thể sử dụng

  • Large Language Model: Qwen3.5 Series, các model <= 9B; Gemma-4 Series.
  • Embedding/Rerank: BGE-m3, Qwen-Rerank.
  • Thiết kế AI Agent xử lý đa tác vụ.
  • Hoặc các mô hình ngôn ngữ lớn khác.

Yêu cầu đầu ra

  • Docker Container: Docker Hub.
  • Entry-point: đọc public_test.csv hoặc private_test.csv tại /data, ghi pred.csv vào /output.
  • Định dạng pred.csv: gồm hai cột qid, answer với đáp án A/B/C/D.
  • Github: chứa code và cách chạy reproduce kết quả trong container.
  • Tài liệu thuyết minh phương pháp: định dạng tùy chọn, làm rõ tính sáng tạo và hiệu quả của chiến lược tối ưu mô hình.

Vòng 2 — Đánh giá private test

  • Ngày 24/5/2026: đội thi nộp phiên bản Docker cuối cùng đã tinh chỉnh và sẵn sàng kiểm chứng.
  • Thời gian đánh giá: 24/5–03/6/2026.
  • Bộ kiểm thử: private test gồm 2000 câu hỏi.
  • Tiêu chí: độ chính xác, thời gian inference và tư duy tối ưu/sáng tạo.
  • Kết quả: BTC chọn Top 6 đội tốt nhất theo tiêu chí vào Vòng 3.

Tiêu chí đánh giá Vòng 2

Nhóm tiêu chíMô tảĐiểm
AccuracyĐiểm Accuracy = a / num_private_sample * 100% * 70, trong đó a là số câu trả lời đúng.80
Thời gian inferenceĐội có thời gian inference nhanh nhất đạt tối đa 10 điểm; các đội tiếp theo tính theo công thức y/x * 100% * 10.10
Ý tưởngĐánh giá phương pháp tối ưu sáng tạo, hiệu quả và khả thi của dự án.10

Vòng 3 — Trình bày trực tuyến

  • Thời gian: dự kiến ngày 12/6/2026.
  • Hình thức: trực tuyến.
  • Thời lượng: mỗi đội có tối đa 08 phút trình bày giới thiệu sản phẩm.
  • Nội dung: live-demo sản phẩm hấp dẫn, trả lời câu hỏi của Ban Giám khảo và câu hỏi phản biện từ các đội thi.

Lộ trình

3 vòng Bảng C

01

Vòng 1

11/05 – 24/05/2026 · Public leaderboard

02

Vòng 2

24/05 – 03/06/2026 · Private test

🏆
03

Vòng 3

12/06/2026 · Trình bày trực tuyến

Lưu ý đăng ký bảng thi

  • Bảng A tham gia dưới dạng cá nhân.
  • Mỗi thí sinh được tham gia tối đa 02 bảng: có thể chỉ thi Bảng A, hoặc thi Bảng A kèm thêm một trong hai bảng B/C. Với nhóm bảng chuyên sâu, thí sinh chỉ chọn một: Bảng B hoặc Bảng C.

Giải thưởng

Cơ cấu giải Bảng C

Bảng C – Innovator

Giải Nhất20.000.000đ
Giải Nhì15.000.000đ
Giải Ba10.000.000đ
Khuyến khích03 giải, 5.000.000đ/giải
0.01172 sec| 657.758 kb