ანოტაცია
მანქანური სწავლების მოდელების მზარდი სირთულე და მონაცემთა დაცვის უფრო მკაცრი რეგულაციები ზრდის დიდი და მრავალფეროვანი მონაცემთა ნაკრებების მოთხოვნას. ალგორითმების მიერ ხელოვნურად გენერირებული სინთეზური მონაცემები წარმოადგენს ამ პრობლემის ძლიერ გადაწყვეტას და ხდება აუცილებელი ინსტრუმენტი თანამედროვე მონაცემთა მეცნიერებასა და ხელოვნურ ინტელექტში. მათი გამოყენება წყვეტს რეალური მონაცემების სიმწირესთან, კონფიდენციალურობის დაცვასთან და ნიმუშის ბალანსის უზრუნველყოფასთან დაკავშირებულ გამოწვევებს. ეს სტატია იძლევა თანამედროვე სინთეზური მონაცემების გენერირების ტექნიკის მიმოხილვას, მათ გამოყენებას ხელოვნურ ინტელექტსა და კომპიუტერულ მეცნიერებაში და განიხილავს ძირითად გამოწვევებსა და სამომავლო კვლევის მიმართულებებს.
წყაროები
André Bauer, “Comprehensive Exploration of Synthetic Data Generation: A Survey,” 02 2024. Internet resurs: https://arxiv.org/pdf/2401.02524. [Accessed: 22/08/2025].
Yingzhou Lu, “Machine Learning for Synthetic Data Generation: A Review,” JOURNAL OF LATEX CLASS FILES, VOL. 14, NO. 8, T, AUGUS 2021. Internet resources: https :// arxiv. org / pdf /2302.04062 v 8. [Accessed: 01/06/2025].
Vasileios C Pezoulas, “Synthetic data generation methods in healthcare: A review on open-source tools and methods,” Comput Struct Biotechnol J. 23:2892–2910., 23 Jul 9 2024. Internet resources: https://www.sciencedirect.com/science/article/pii/S2001037024002393. [Accessed: 23/06/2025].
Shuang Hao, “Synthetic Data in AI: Challenges, Applications, and Ethical Implications,” 01 Jan 2024. Internet resources: https :// arxiv . org / html /2401.01629 v 1. [Accessed: 12/06/2025].
Lin Long, “On LLMs-Driven Synthetic Data Generation, Curation, and Evaluation: A Survey,” 14 Jul 2024. Internet resources: https :// arxiv . org / pdf /2406.15126 v 1. [Accessed: 12/06/2025].