Februar 2019: Dieses Korpus enthält je rund 1600 "News" der Credit Suisse Webseite in Deutsch, Französisch, Italienisch und Englisch. Das Korpus ist für Forschungszwecke frei verfügbar. Weitere Informationen zum Korpus in der Readme-Datei.
Download: Credit Suisse News Corpus Release 5.0 (~ 2 Millionen Token pro Sprache, mit PoS-Tags und Lemmas; 73 MByte).
Juli 2019: Dieses Korpus enthält insgesamt 416 Magazine. Es gibt je rund 2500 Artikel des Credit Suisse Bulletins in Deutsch, Französisch, Italienisch und rund 1200 in Englisch. Das Korpus ist für Forschungszwecke frei verfügbar. Weitere Informationen zum Korpus in der Readme-Datei.
Download: Credit Suisse PDF Bulletin Corpus Release 6.0 (~ 3 Millionen Token pro Sprache, mit PoS-Tags und Lemmas; 118 MByte).
Februar 2019: Dieses Korpus enthält rund 700 Magazine in Deutsch und Französisch, rund 100 Magazine in Englisch und Italienisch und 19 Magazine in Spanisch. Das Korpus ist für Forschungszwecke frei verfügbar. Weitere Informationen zum Korpus in der Readme-Datei.
Download: Credit Suisse Bulletin In Print Corpus Release 3.0 (~ 15 Millionen Token de/fr, ~ 5 Millionen Token en/it, ~ 1 Million Token es;, mit PoS-Tags und Lemmas; 328 MByte).