BREIN haalt groot AI taalmodel offline
Bart Janssen | 28 januari 2025BREIN heeft afgelopen week een groot Nederlands generatief AI taalmodel offline gehaald, genaamd GEITje-7B. Het model was getraind op de grootste Nederlandstalige trainingsdataset die BREIN afgelopen zomer al offline haalde. BREIN heeft de aanbieder onder meer aangesproken omdat het model getraind was op tienduizenden kopieën van Nederlandstalige boeken uit de illegale bron Library Genesis, een dienst die door de Nederlandse rechter onrechtmatig is bevonden en op verzoek van BREIN wordt geblokkeerd door de Nederlandse access providers. Het taalmodel GEITje-7B is verder ook nog getraind op teksten die zijn gekopieerd van nieuwssites zonder dat daar toestemming voor is gegeven.