• 語料庫

    Corpus
    美國當代英語語料庫(單語)

    美國當代英語語料庫(單語)

    美國當代英語語料庫(Corpus of Contemporary American English,簡稱COCA)是目前最大的免費英語語料庫,它由包含5.2億詞的文本構成,這些文本由口語、小說、流行雜志、報紙以及學術文章五種不同的文體構成。
    美國楊百翰大學BNC語料庫(單語)

    美國楊百翰大學BNC語料庫
    (單語)

    由美國楊百翰大學語言學教授創立,下設多個字庫,語料極其豐富。
    美國國家語料庫(單語)

    美國國家語料庫(單語)

    最大的關于美語使用現狀的語料庫,記錄了自1990年起美語口頭和書面語,詞量達2200萬。
    BNC (British National Corpus) (單語)

    BNC (British National Corpus)
    (單語)

    英國國家語料庫由牛津出版社、朗文出版公司和大英圖書館等機構共同建立。其中包括廣泛的書面語和口語,書面語90%,口語10%,總詞量超過1億。
    Web Concordance English (單語)

    Web Concordance English
    (單語)

    綜合多個語料庫,內容包括歷屆美國總統演講及電視節目、學術、法律等,有口語和書面語兩種形式,詞量達數千萬。
    Michigan Corpus of Academic Spoken English (單語)

    Michigan Corpus of Academic Spoken English(單語)

    密歇根大學英語語言所建立,內容主要為學術英語口語,詞量達184萬。
    Linggle

    Linggle
    (單語)

    臺灣“清華大學”Linggle 系統是少數由學界開發且規模逼近業界搜尋引擎的特例。Linggle檢索引擎是一個可用于英語翻譯的語法工具和句子工具,可幫助譯者根據詞性來檢索搭配,提高譯文的豐富度和準確度。
    Sketch Engine(單語)

    Sketch Engine(單語)

    語料庫檢索工具Sketch Engine支持單詞概覽、單詞辨析、單詞搭配、同義詞查找、語料索引、建立語料庫等豐富的核心功能,被應用于詞典編撰、語言教育和翻譯研究等多領域。另外,該工具也能基于網絡資源或本地文檔,自建特色語料庫,提取單詞表。
    Online BLCKWIC Concordancer(雙語,英語、日語)

    Online KWIC Concordancer
    (雙語、英語、日語)

    商業信函及其他信函類語料庫,由日本人建立,包括商業信函、名人信函、美國總統國情咨文部分名著等。
    BOE——柯林斯英語語料庫(the Bank of English)

    BOE——柯林斯英語語料庫
    (the Bank of English)

    為目前世界三大著名語料庫之一,該語料庫(The Bank of English)為英國伯明翰大學與Harper Collins出版社合作建立的COBUILD語料庫的一部分,目前固定在4.5億詞的規模,可以在線檢索。
    WebCorp

    WebCorp

    由伯明翰城市大學英語學院英語研究小組開發的網絡語料庫WebCorp 除了具有傳統語料庫檢索軟件的詞表(wordlist)、語篇統計(token與type數目統計)、KWIC索引(語境共現)、搭配統計(Key phrases)、詞語型式(pattern)統計等功能以外,還具有網絡語料庫特有的功能。它能夠設定常見詞(stop words)排除,將the、a等常見詞從搭配中自動去除掉,這樣檢索出來的詞語搭配更加精煉準確;能夠設定搜索的域名范圍、時間范圍,可以提供不同地區、不同時期的語料資源。
    現代漢語平衡語料庫(單語)

    現代漢語平衡語料庫(單語)

    現代漢語平衡語料庫的通用性和平衡性通過語料樣本的分布廣度和比例控制實現。語料輸出可選生語料與標注語料。該語料庫共有三種檢索模式,分別是:整詞匹配、模糊匹配、全文檢索。
    清華大學中英平行語料庫

    清華大學中英平行語料庫

    清華大學中英平行語料庫由清華大學自然語言處理與社會人文計算實驗室在國家“863 計劃” 項目“ 互聯網語言翻譯系統研制” 的支持下,利用自身研發的互聯網平行網頁獲取軟件和雙語句子自動對齊軟件獲取并處理得到的,共包含285萬中英平行句對。
    北京語言大學語料庫中心BCC語料庫”

    北京語言大學語料庫中心
    Bcc語料庫

    BCC語料庫是以漢語為主,兼有英語、西班牙語、法語、德語、土耳其語等語言的語料庫,其中漢語語料規模約150億字,涵蓋了報刊、文學、微博、科技、綜合和古漢語等多領域語料。Bcc語料庫包括了生語料、分詞語料、詞性標注語料和句法樹,目前已對現代漢語、英語、法語的語料進行詞性標注。
    中文語言資源聯盟

    中文語言資源聯盟

    中文語言資源聯盟是由中國中文信息學會語言資源建設和管理工作委員會發起,由中文語言(包括文本、語音、文字等)資源建設和管理領域的科技工作者自愿組成的學術性、公益性、非盈利性的社會團體,具有完整性、權威性、系統性和開放性的特點,涵蓋中文信息處理各個層面上所需要的語言語音資源,包括詞典、各種語音語言語料庫、工具等。
    香港教育學院“LIVAC漢語共時語料庫”

    香港教育學院
    “LiVaC漢語共時語料庫”

    LIVAC漢語共時語料庫以嚴謹、恒常與「共時」方式,搜索和處理了超常的大量具代表性漢語平面媒體語料,并通過精密的技術,累積了泛華語地區眾多精確的語言和語用統計數據。本語料庫最大特點是采用「共時性」視窗模式,剖析來自香港,北京,上海,臺灣,澳門,新加坡等多地有代表性的定量華語媒體語料。直至2016年,LiVaC已累計過濾25億漢字語料,并已處理逾6億字,累積并持續提煉出2百多萬詞條。
    漢語中介語語料庫”

    漢語中介語語料庫

    漢語中介語語料庫由北京語言大學于1992年開始建設。該語料庫立足于漢語教學已收錄1635位外國學生共5774篇成篇成段的漢語作文或練習材料,總字數約353萬,其中1731 篇約104萬字的語料經過斷句、分詞和詞性標注等加工處理。目前該漢語中介語料庫仍處于努力建設過程中,北京語言大學仍然努力于建設全球漢語中介語語料庫,其規模預計達5000萬字,包括筆語語料、口語語料和多模態子庫。筆語語料規模預計達4500萬字,其中2000萬字將加工成為熟語料;口語語料450小時,約合400萬字;多模態語料110小時,約合100萬字。
    北大法律英文網

    北大法律英文網

    北大法律英文網并非嚴格意義上的語料庫,但是它可以檢索法律新聞、法律法規、司法判例、法律期刊、國際條約、白皮書、政府公報與法律術語,支持中英文雙語對照查看,方便譯者研究、理解和提高用詞準確度,進一步提升法律翻譯能力,所以一定程度上可以作為語料庫使用。
    知網翻譯助手

    知網翻譯助手

    知網翻譯助手是以知網總庫所有文獻數據為依據,不僅提供英漢詞語、短語的翻譯檢索,還可以提供句子的翻譯檢索。不但對翻譯需求中的每個詞給出準確翻譯和解釋,還給出大量與翻譯請求在結構上相似、內容上相關的例句,方便譯者得到恰當的翻譯結果。
    句酷

    句酷

    句酷致力于幫助非英語母語者尋找地道表達,提高譯文準確性。句酷的雙語例句庫語料量大、覆蓋面廣、真實地道,目前支持中英、中日、日英三種語言對的檢索。不僅可以查找雙語例句,同時具備詞典功能,提供高頻搭配供譯者選擇。
    通譯典

    通譯典

    通譯典的翻譯句庫是目前國內最大的翻譯例句庫,通譯典開發小組編撰句庫的目的是為廣大翻譯工作者提供翻譯參考。

    其他單語語料庫

    其他雙語/多語語料庫

    亚洲欧美vr色区