eng DaSciTex
deu Das Darmstadt Corpus of Scientific Texts (DaSciTex) besteht aus Vollversionen englischer wissenschaftlicher Zeitschriftenartikel aus 23 Quellen und umfaßt 9 verschiedene wissenschaftliche Domänen. Der Aufbau des Korpus ist dreigliedrig: eine zentrale Disziplin (Informatik), vier 'reine' Kontaktdisziplinen (Linguistik, Biologie, Maschinenbau, Elektrotechnik), vier dazugehörige Mischdisziplinen (Computerlinguistik, Bio-Informatik, CAD, Mikroelektronik). Es gibt zwei Versionen des Korpus: ein kleines manuell korrigiertes Korpus (ca. eine Million Wörter), ein großes Korpus (17 Millionen Wörter).
eng Synchronic corpus of scientific texts from 9 different disciplines. The Darmstadt Corpus of Scientific Texts (DaSciTex) contains full English scientific journal articles compiled from 23 sources covering nine scientific domains. The corpus has a three-way partition: a center discipline (computer science) four 'pure' contact disciplines (linguistics, biology, mechanical engineering, electrical engineering) and four corresponding 'mixed' disciplines (computational linguistics, bio-informatics, computer-aided design, micro-electronics). The corpus comes in two versions: a small manually checked corpus (approx. one million words), a large corpus (17 million words).
Englisch
17 Millionen Wörter
restricted for individual
10355ff5-e2ca-4c4d-b854-f603a43a92ec
c1c9b626-0a08-4962-9a02-04fd60f7cd5f
nicht vorhanden
CLARIND-UdS: Repositorium für Sprachressourcen an der Universität des Saarlandes
corpus
Sprachwissenschaften
geschrieben