Language
Data speelt een cruciale rol bij de ontwikkeling van state-of-the-art Language Technology (LT)-toepassingen zoals chatGPT, Bing of spraakherkenningssystemen zoals Siri of Alexa. Organisaties in deze sector hebben vaak moeite om voldoende gegevens te verzamelen voor taalgerichte AI-ontwikkeling vanwege gefragmenteerde bronnen, privacyproblemen en de hoge kosten voor het verwerven en onderhouden van gegevens. De European Language Data Space (LDS) zou bedrijven gemakkelijk toegang kunnen bieden tot diverse, hoogwaardige datasets waar belanghebbenden hun taalbronnen kunnen verzilveren zonder de controle in gevaar te brengen.
De European Language Data Space (LDS) bouwt een betrouwbare datamarkt op voor het uitwisselen van taalbronnen tussen de publieke en private sector, in lijn met de EU-datastrategie. Initiatieven zoals ALT-EDIC hebben een gemeenschappelijke Europese infrastructuur voor taaltechnologieën ontwikkeld om de beschikbaarheid van taalgegevens te vergroten en tegelijkertijd de taalkundige diversiteit en culturele rijkdom te behouden. Een ander initiatief, ELRC, heeft een meertalig digitaal ecosysteem met 3.306 taalbronnen tot stand gebracht, met als doel taalbarrières te slechten en inclusiviteit te bevorderen. Andere initiatieven zoals META-SHARE en European Language Equality (ELE) bieden open en veilige netwerken voor het delen van taalgegevens, hulpmiddelen en gerelateerde webdiensten om de Digital Language Equality te behouden.
De iSHARE Foundation biedt een veilig, interoperabel Trust Framework voor uitdagingen die verband houden met gefragmenteerde gegevensbronnen, privacyproblemen en hoge kosten voor gegevensbeheer. Dit zorgt voor een veilige, betrouwbare uitwisseling van taalgegevens, waardoor bedrijven toegang krijgen tot diverse, hoogwaardige taalgegevenssets die essentieel zijn voor de ontwikkeling van geavanceerde Language Technology (LT)-toepassingen zoals chatbots en spraakherkenningssystemen. De iSHARE Foundation biedt ook een juridische overkoepelende overeenkomst die ervoor zorgt dat alle deelnemers aan de data space binnen een uniform juridisch raamwerk opereren zonder het eigendom en de controle van de data in gevaar te brengen.
Ontdek hoe organisaties in de taalsector potentieel kunnen profiteren van de implementatie van het iSHARE Trust Framework.