Από τα German Commons στα Greek Commons
Γιατί η ελληνική γλώσσα χρειάζεται μια εθνική και ευρωπαϊκή ανοικτή υποδομή δεδομένων Η εκπαίδευση μεγάλων γλωσσικών μοντέλων βασίζεται σε τεράστιους όγκους κειμένου, όμως η ποσότητα χωρίς καθαρή αδειοδότηση και τεκμηριωμένη προέλευση δημιουργεί νομική αβεβαιότητα, περιορισμένη επαναχρησιμοποίηση και χαμηλή επιστημονική αξιοπιστία. Το German Commons αποτελεί σημείο καμπής: 154,56 δισ. tokens, 41 πηγές, επτά θεματικοί τομείς, με … Read more





