Đánh giá hiệu suất giải toán xác suất của ChatGPT (phiên bản GPT-5) dựa trên các bộ sách Toán 12 theo Chương trình 2018

Các tác giả

  • Phạm Thành Đạt Trường Đại học Sư phạm Thành phố Hồ Chí Minh
  • Lê Thái Bảo Thiên Trung Trường Đại học Sư phạm Thành phố Hồ Chí Minh
  • Lê Hoàng Minh Quân Trường Đại học Sư phạm Thành phố Hồ Chí Minh
  • Hoàng Thị Minh Thư Trường Đại học Sư phạm Thành phố Hồ Chí Minh

Tóm tắt

Conditional probability is a central topic in the Grade 12 Mathematics curriculum, demanding a high level of logical reasoning. Amid the rapid advancement of large language models in education, this study evaluates the accuracy and reasoning quality of GPT-5 on Grade 12 probability problems through a mixed-methods approach - combining quantitative and qualitative analysis - applied to a dataset of 513 problems drawn from current Grade 12 Mathematics textbooks. Accuracy rates were statistically quantified, while qualitative analysis identified characteristic reasoning patterns and error types. The findings indicate that GPT-5 correctly solved 84.01% of the textbook problems. The model demonstrated proficiency in formula application but exhibited notable difficultiesin reasoning, particularly in tasks requiring the construction and interpretation of tree diagrams. These findings provide teachers with empirical evidence regarding the reliability of GPT-5 as a instructional tool. The study recommends extending the evaluation to other mathematical topics, investigating student–ChatGPT interactions in authentic learning contexts, and conducting controlled experimental studies to establish causal evidence for the pedagogical integration of AI in mathematics education.

Tài liệu tham khảo

Đào Xuân Quy, Ngô Bắc Biển, Phan Xuân Dũng, Lê Ngọc Bích (2024). Đánh Giá ChatGPT trong việc giải Đề thi minh họa kì thi tốt nghiệp trung học phổ thông 2023 tại Việt Nam. Tạp chí Khoa học Giáo dục Kỹ thuật, Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh, 19(2), 1-11. https://doi.org/10.54644/jte.2024.1365

Frieder, S., Pinchetti, L., Chevalier, A., Griffiths, R.-R., Salvatori, T., Lukasiewicz, T., Petersen, P. C., & Berner, J. (2024). Mathematical capabilities of ChatGPT. Transactions on Machine Learning Research. https://openreview.

net/forum?id=0oOtdrlILW

Hagendorff, T., Fabi, S., & Kosinski, M. (2023). Human-like intuitive behavior and reasoning biases emerged in large language models but disappeared in ChatGPT. Nature Computational Science, 3, 833-838. https://doi.org/

1038/s43588-023-00527-x

Hendrycks, D., Burns, C., Kadavath, S., Arora, A., Basart, S., Tang, E., Song, D., & Steinhardt, J. (2021). Measuring mathematical problem solving with the MATH dataset. Advances in Neural Information Processing Systems, 34 (NeurIPS 2021 Datasets and Benchmarks Track).

Kasneci, E., Sessler, K., Küchemann, S., Bannert, M., Dementieva, D., Fischer, F.,... & Kasneci, G. (2023). ChatGPT for Good? On Opportunities and Challenges of Large Language Models for Education. Learning and Individual Differences, 103, 102274. https://doi.org/10.1016/j.lindif.2023.102274

Kaya, D., & Yavuz, S. (2025). Can generative AI and ChatGPT break human supremacy in mathematics and reshape competence in cognitive-demanding problem-solving tasks? Journal of Intelligence, 13(4), 43. https://doi.org/10.3390/jintelligence13040043

Lê Anh Vinh, Bùi Thị Diển, Lê Quang Quân, Vũ Văn Luân (2023). Khả năng thực hiện bài kiểm tra định kì môn Toán và môn Ngữ văn cấp Trung học của công cụ ChatGPT: Kết quả nghiên cứu và một số khuyến nghị ban đầu. Tạp chí Khoa học Giáo dục Việt Nam, 19(2), 1-10.

Lo, C. K. (2023). What is the impact of ChatGPT on education? A rapid review of the literature. Education Sciences, 13(4), 410. https://doi.org/10.3390/educsci13040410

Pardos, Z. A., & Bhandari, S. (2024). ChatGPT-generated help produces learning gains equivalent to human tutor-authored help on mathematics skills. PLOS ONE, 19(5), e0304013. https://doi.org/10.1371/journal.pone.0304013

Turmuzi, M., Azmi, S., & Kertiyani, N. M. I. (2026). ChatGPT in school mathematics education: A systematic review of opportunities, challenges, and pedagogical implications. Teaching and Teacher Education, 170, 105286.

Tải xuống

Đã Xuất bản

29.04.2026

Cách trích dẫn

Phạm Thành Đạt, P. T. Đạt, Lê Thái Bảo Thiên Trung, L. T. B. T. T., Lê Hoàng Minh Quân, L. H. M. Q., & Hoàng Thị Minh Thư, H. T. M. T. (2026). Đánh giá hiệu suất giải toán xác suất của ChatGPT (phiên bản GPT-5) dựa trên các bộ sách Toán 12 theo Chương trình 2018. Tạp Chí Giáo dục, 26(đặc biệt 3), 136–142. Truy vấn từ https://tcgd.tapchigiaoduc.edu.vn/index.php/tapchi/article/view/6073

Số

Chuyên mục

Các bài báo

Các bài báo được đọc nhiều nhất của cùng tác giả