KONVENTIONEN
Dateinamen #
Verwenden Sie für die Benennung von Dateien und Ordnern nur alphanumerische Zeichen ohne Sonderzeichen wie Anführungszeichen, Satzzeichen, Diakritika, Leerzeichen, Schrägstriche und dergleichen. Unterstriche (_) und Bindestriche (-) können verwendet werden. Weitere Hinweise finden Sie in den Empfehlungen von IANUS.
PRÄFERENZEN
Formate #
Wir empfehlen, die Ressourcen in Standardformaten bereitzustellen, die von den jeweiligen Forschungsgemeinschaften anerkannt werden. Wir unterstützen Sie bei der Konvertierung der Daten, wenn dies notwendig und machbar ist.
Geeignete Formate sollten weit verbreitet sein und wenn möglich offenen und nicht-proprietären Standards entsprechen. Dateien sollten nicht durch ein Passwort geschützt, verschlüsselt oder verlustbehaftet komprimiert werden. Sofern Dateien von Verweisen auf andere Dateien, Schriftarten oder andere externe Daten abhängen, sollten diese Objekte ebenfalls archiviert oder zumindest in beispielsweise einer README-Datei beschrieben werden. Wann immer eine Auswahl für die Kodierung möglich ist, wählen Sie bitte UTF-8 ohne Byte Order Mark (BOM) (siehe [FAQ]).
Sofern Dateikonvertierungen erforderlich sind, sollte der potenzielle Informationsverlust minimiert werden. Ist eine verlustfreie Konvertierung in ein offenes oder empfohlenes Format nicht möglich, werden die Originaldateien zusammen mit den konvertierten Versionen archiviert.
Das bevorzugte Format für annotierte Textdaten in unserem Repositorium ist TEI/XML (Text Encoding Initiative) mit Metadaten in “teiHeaders”. Darüber hinaus müssen alle Sprachressourcen in CMDI (Component Metadata Infrastructure) beschrieben werden, die automatisch auf Basis der ARCHE Metadaten generiert werden. Einen Überblick über die empfohlenen Standardformate finden Sie in den CLARIN-Empfehlungen für Standards.
Für andere Formate, die nicht in den CLARIN-Standards enthalten sind, sowie für allgemeine Textformate und Medienformate finden Sie in der von uns bereitgestellten Tabelle eine Übersicht der bevorzugten und akzeptierten Formate. Die Tabelle basiert auf den von IANUS und dem Archaeology Data Service empfohlenen Formaten.
Bevorzugte und akzeptierte Formate in ARCHE (08. 2017). Bevorzugte Formate sind für die Langzeitkonservierung geeignet. Akzeptierte Formate erfordern eine Konvertierung.
EXTENSION | FORMAT NAME & VERSION | PREFERENCE |
---|---|---|
DATASET | ||
csv | Comma-Separated Values | preferred |
dbf | dBase database file | accepted |
dbf | dBase database file | accepted |
siard | Software Independent Archiving of Relational Databases | preferred |
xml | eXtensible Markup Language | preferred |
fp5, fp7, fmp12 | FileMaker Databases | accepted |
bak | binary export formats for databases | accepted |
accdb | Microsoft Access Databases | accepted |
db | binary export format for databases | accepted |
dmp | binary export formats for databases | accepted |
json | Javascript Object Notation | accepted |
mdb | Microsoft Access Databases | accepted |
odb | Open Document Databases | accepted |
xls | Microsoft Excel | accepted |
ods | Open Document Format | preferred |
sql | Structured Query Language | preferred |
tsv | Tab Separated Values | preferred |
xlsx | Office Open XML Workbook (Microsoft) | preferred |
IMAGE | ||
dxf | Drawing Interchange Format (Autodesk) | accepted |
jpg, jpeg | Joint Photographic Expert Group | accepted |
png | Portable Network Graphics | accepted |
svg | Scalable Vector Graphis 1.1, uncompressed | preferred |
tif, tiff | Baseline TIFF v. 6, uncompressed | preferred |
ai, indd | Adobe Illustrator, Adobe InDesign | accepted |
bmp | Bit-Mapped Graphics Format (Microsoft) | accepted |
cgm | Computer Graphics Metafile, WebCGM | accepted |
cpt | CorelPaint | accepted |
dwf | Design Web Format (Autodesk) | accepted |
dwg | Drawing (Autodesk) | accepted |
eps, ps | PostScript, Encapsulated PostScript | accepted |
jp2, jpx | JPEG2000 | accepted |
psd | Photoshop (Adobe) | accepted |
dng | Adobe Digital Negative | preferred |
AUDIO / VIDEO | ||
gif | Graphics Interchange Format | accepted |
mkv | Matroska | preferred |
aac | Advanced Audio Coding | accepted |
mp4 | MP4 | accepted |
aiff | Audio Interchange File Format | accepted |
asf | Advances Systems Format (ASF/WMV) | accepted |
avi | Audio Video Interactive | accepted |
f4v | Flash | accepted |
mj2 | Motion JPEG 2000 | accepted |
mov | QuickTime File Format | accepted |
mp3 | MP3 | accepted |
mp4 | MPEG-4 | accepted |
mpeg | MPEG-2 | accepted |
mxf | Material eXchange Format | accepted |
ogg, ogm, ogv, ogx, spx | Ogg | accepted |
wav | RF64/MBWF | accepted |
wma | Windows Media Audio | accepted |
wmv | Advanced Systems Format (ASF/WMV) | accepted |
bwf | Broadcast Wave Format | preferred |
flac | Free Lossless Audio Codec | preferred |
wav | Waveform Audio File Format | preferred |
TEXT DOCUMENTS | ||
html | HyperText Markup Language | preferred |
other PDF variants | preferred | |
txt | Plain Text | preferred |
doc | Microsoft Word | accepted |
maff | Mozilla Archive Format | accepted |
rtf | Rich Text Format | accepted |
sxc | Open Office XML | accepted |
docx | Office Open XML Document (Microsoft) | preferred |
dtd | Document type definition | preferred |
htm, html | HyperText Markup Language | preferred |
mht, mhtml | MIME Encapsulation of Aggregate HTML Documents | preferred |
odt | Open Document Format | preferred |
sgml | Markp Text | preferred |
warc | WebArchive | preferred |
xht, xhtml | Extensible HyperText Markup Language | preferred |
xsd | XML Schema definition | preferred |
3D DATA | ||
obj | Wavefront .obj file | preferred |
ply | Polygon File Format, Stanford Triangle Format | preferred |
x3d | eXtensible 3D Graphics | preferred |
stl | Standard Tessellation Language | accepted |
u3d | Universal 3D Format | accepted |
vrml | Virtual Reality Modeling Language | accepted |
dae | COLLADA | preferred |
WER, WAS, WANN, WIE
Metadaten #
Metadaten sollten grundlegende Fragen zu Ihren Daten beantworten, um anderen zu ermöglichen, die Daten zu verstehen, sie zu finden und zu teilen. Gute Metadaten geben Auskunft darüber, wie Daten produziert wurden, wer an der Erstellung beteiligt war und worum es sich bei den Daten handelt. Die Verwendung von Metadaten ist ein wesentlicher Bestandteil der Einhaltung der FAIR-Data-Prinzipinen, um die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit von Daten zu gewährleisten (siehe [FAQ]).
Metadaten erlauben es, unterschiedliche Informationsebenen zu berücksichtigen, z.B. ganze Datensammlungen, einzelne Dateien und sogar granulare Datensätze. Idealerweise werden Metadaten unter Verwendung eines Standardformats so genau und so vollständig wie möglich erfasst. Der Archaeology Data Service und IANUS bieten formatunabhängige Metadaten auf Sammlungsebene an, die auf alle Arten von Fachdomänen angewendet werden können. Darüber hinaus werden in den entsprechenden Abschnitten der IT-Empfehlungen von IANUS Metadaten auf Dateiebene dargestellt, die im Allgemeinen eher technischer Natur sind und stark vom Datentyp und den angewandten Methoden abhängen.
Die für die Archivierung in ARCHE erforderlichen Metadaten sind in der Tabelle mit Metadatenanforderungen angeführt. In ARCHE werden neben Metadaten auf Sammlungs- und Dateiebene auch Metadaten auf Projektebene gespeichert. Von ARCHE vorgeschriebene Pflichtfelder sind als solche gekennzeichnet. Jedoch erhöht die Verwendung empfohlener Felder die Auffindbarkeit, Verständlichkeit und Zitierbarkeit der Daten substantiell. Das Metadatenschema von ARCHE ist im OWL-Format mit umfangreicher Dokumentation verfügbar, wahlweise auch in einer tabellarischen Darstellung.
Attribute sind für Projekte, Sammlungen und Ressourcen aufgelistet.
m = mandatory, r = recommended, o = optional, and * = property can be used multiple times.
ORIENTIERUNG
Wichtige Informationen