第一題:連續(xù)正整數(shù)(10分) 題目描述: 輸入數(shù)據:一個正整數(shù),以命令行參數(shù)的形式提供給程序,。
第二題:重疊區(qū)間大?。?0分) 題目描述: 輸入數(shù)據:
第三題:字符串替換(30分) 題目描述:請編寫程序,,根據指定的對應關系,把一個文本中的字符串替換成另外的字符串,。 輸入數(shù)據:程序讀入已被命名為text.txt和dict.txt的兩個輸入數(shù)據文本文件,,text.txt為一個包含大量字符串(含中文)的文 本,以whitespace為分隔符,;dict.txt為表示字符串(s1)與字符串(s2)的對應關系的另一個文本(含中文),,大約在1萬行左右,每行 兩個字符串(即s1和s2),,用一個\t或空格分隔,。dict.txt中各行的s1沒有排序,并有可能有重復,,這時以最后出現(xiàn)的那次s1所對應的s2為 準,。text.txt和dict.txt中的每個字符串都可能包含除whitespace之外的任何字符。text.txt中的字符串必須和 dict.txt中的某s1完全匹配才能被替換,。(為便于調試,,您可下載測試text.txt和dict.txt文件,實際運行時我們會使用不同內容的輸 入文件,。) 輸出數(shù)據:在標準輸出上打印text.txt被dict.txt替換后了的整個文本,。 評分標準:程序輸出結果必須正確,內存使用越少越好,,程序的執(zhí)行時間越快越好,。 第四題:低頻詞過濾(40分) 題目描述:請編寫程序,從包含大量單詞的文本中刪除出現(xiàn)次數(shù)最少的單詞,。如果有多個單詞都出現(xiàn)最少的次數(shù),,則將這些單詞都刪除。 輸入數(shù)據:程序讀入已被命名為corpus.txt的一個大數(shù)據量的文本文件,,該文件包含英文單詞和中文單詞,,詞與詞之間以一個或多個whitespace分隔。(為便于調試,您可下載測試corpus.txt文件,,實際運行時我們會使用不同內容的輸入文件,。) 輸出數(shù)據:在標準輸出上打印刪除了corpus.txt中出現(xiàn)次數(shù)最少的單詞之后的文本(詞與詞保持原來的順序,仍以空格分隔),。 評分標準:程序輸出結果必須正確,,內存使用越少越好,程序的執(zhí)行時間越快越好,。 |
|