Clarin.dk

Ressourcetyper i Clarin.dk

Opdateret: juli 2011

Liste over ressourcetyper i Clarin.dk

Der er 9 overordnede ressourcetyper i Clarin.dk, nogle af dem er neddelt i to eller tre ressourcetyper. Fx er der to forskellige tekst-ressourcetyper, en avanceret hvor der er flere oplysninger om teksten og som er tilpasset brug af værktøjer mv, samt en simpel, som gør det muligt at deponere tekster med færre oplysninger og færre muligheder. For Mediaannoteringer er der tre ressourcetyper, som giver mulighed for at skelne mellem formatet for mediaannoteringen.

NB: Billeder er på nuværende tidspunkt ikke en selvstændig ressourcetype, men deponeres som en tekst med billeder tilknyttet. Aligneringer er på nuværende tidspunkt ikke en selvstændig ressourcetype, men deponeres som data.

For alle ressourcetype sker der en validering ved deponering, mere information om validering kan læses her.

  1. Tekstressourcer i TEIP5DKCLARIN-format, evt. med billeder
  2. Tekstressourcer i TEI-format
  3. Tekstannoteringer
  4. Lydressourcer
  5. Videoressourcer
  6. Mediaannoteringsressourcer i IMDI-SESSION-XML-format
  7. Mediaannoteringsressourcer i IMDI-SESSION-PRAT-format
  8. Mediaannoteringsressourcer i IMDI-SESSION-CHAT-format
  9. Leksikonressourcer
  10. Værktøjsressourcer
  11. Dataressourcer og tekstaligneringer

Tekstressourcer i TEIP5DKCLARIN-format, evt. med billeder

Tekstressourcer i TEIP5DKCLARIN-formatet kan have tilknyttet billeder. Hvis der er tilknyttet billeder kan de ses, når man vælger fanebladet "Vis indholdsdata" for ressourcen. Metadataformatet er beskrevet her og formatet for teksten er beskrevet her.

Tekstressourcer i TEI-format

Tekstressourcer i TEI-format har færre metadatainformationer og kan ikke benyttes i samme omfang i infrastrukturen som tekster i TEIP5DKCLARIN-format. Vi anbefaler derfor at man så vidt muligt benytter TEIP5DKCLARIN-formatet. Se evt. rng-skemaet: http://clarin.dk/schemas/tei/TEIDKCLARIN-plain-tei.rng for flere detaljer.

Tekstannoteringer

Formatet for annoteringerne er beskrevet her Headeren er mere simpel end tekst-headeren, dog gælder dokumentationen derfra for <appInfo> . Se evt. også DKCLARIN_Metadata_Tekstannoteringer_jul2011.pdf

Lydressourcer

Findes i formaterne: avi, mp3.

Video-ressourcer

Findes i formaterne: mov, avi.

Mediaannoteringsressourcer i IMDI-SESSION-XML-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytte xml-format for annoteringerne. Dette format benyttes bl.a. af Anvil (Generic Annotation Tool for Multimodal Dialogue) , se evt. mere her.

Mediaannoteringsressourcer i IMDI-SESSION-PRAT-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Praat TextGrid, se evt. her.

Mediaannoteringsressourcer i IMDI-SESSION-CHAT-format

Der er de samme muligheder for metadata-informationer i alle tre typer af IMDI-sessioner. Forskellen mellem de tre IMDI-sessioner er alene annoteringsformatet. Denne type benytter Childes' CLAN-format, se evt. her.

Leksikon-ressourcer

Leksikon-ressourcer ligger som en pakket fil. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.

Data-ressourcer og tekstaligneringer

Alle andre typer af ressourcer kan deponeres som data. Tekstaligneringer deponeres som data, da de endnu ikke er oprettet som en selvstændig ressourcetype. Der kan også deponeres en README-fil, hvor man kan få yderligere oplysninger.

Værktøjsressourcer

Der er mulighed for at deponere værktøjer i Clarin.dk. Nogle værktøjer er integrerede, disse vises også ved en søgning, men du har yderligere mulighed for at afvikle integrerede værktøjer ved at lægge nogle ressourcer i Kurven og dernæst vælge "Værktøjer".