%!s(int64=3) %!d(string=hai) anos · 6a3f35d6db
--- a/.gitignore
+++ b/.gitignore
@@ -0,0 +1,4 @@
 
				+__pycache__/
			
 
				+data/tmp/*.pkl
			
 
				+data/tmp/*.txt
			
 
				+data/tmp/*.csv
			
--- a/analyse.py
+++ b/analyse.py
@@ -0,0 +1,109 @@
 
				+# -*- coding:utf-8 -*-
			
 
				+
			
 
				+import math
			
 
				+import jieba
			
 
				+import re
			
 
				+
			
 
				+
			
 
				+word_dict = {}
			
 
				+
			
 
				+SPECIAL_SIMBOL = [".", "?", "^", "$", "*", "+", "\\", "[", "]", "|", "{", "}", "(", ")"]
			
 
				+
			
 
				+def cut_word(word):
			
 
				+    """
			
 
				+    分词
			
 
				+    """
			
 
				+    word_root = jieba.cut_for_search(word)
			
 
				+    return list(word_root)
			
 
				+
			
 
				+def merge_word_root(word_root_a, word_root_b):
			
 
				+    """
			
 
				+    合并词根
			
 
				+    """
			
 
				+    return list(set(word_root_a).union(set(word_root_b)))
			
 
				+
			
 
				+def gen_word_vector(word_a, word_b, word_root_union):
			
 
				+    """
			
 
				+    生成词向量
			
 
				+    """
			
 
				+    a_word_vector, b_word_vector = [], []
			
 
				+    for word in word_root_union:
			
 
				+        if word in SPECIAL_SIMBOL :
			
 
				+            word = "\\" + word
			
 
				+        a_word_vector.append(len(re.findall(word, word_a)))
			
 
				+        b_word_vector.append(len(re.findall(word, word_b)))
			
 
				+    return a_word_vector, b_word_vector
			
 
				+
			
 
				+def vector_multi(a_vector, b_vector):
			
 
				+    """
			
 
				+    向量相乘求和
			
 
				+    """
			
 
				+    return sum(map(lambda a_b: a_b[0]*a_b[1], zip(a_vector, b_vector)))
			
 
				+
			
 
				+def vector_square_sum(word_vector):
			
 
				+    """
			
 
				+    向量平方求和
			
 
				+    """
			
 
				+    sum = 0
			
 
				+    for i in word_vector:
			
 
				+        sum = sum + i * i
			
 
				+    return sum
			
 
				+
			
 
				+def vector_cos(v_multi, a_v_ss, b_v_ss):
			
 
				+    """
			
 
				+    计算余弦值
			
 
				+    """
			
 
				+    return v_multi / (math.sqrt(a_v_ss) * math.sqrt(b_v_ss))
			
 
				+
			
 
				+def cal_cos(a_word, b_word):
			
 
				+    """
			
 
				+    计算两个长尾关键词的余弦值
			
 
				+    """
			
 
				+    a_word_root = cut_word(a_word)
			
 
				+    b_word_root = cut_word(b_word)
			
 
				+
			
 
				+    # a_word_root = word_dict[a_word]
			
 
				+    # b_word_root = word_dict[b_word]
			
 
				+
			
 
				+    # 合并词根，用于生成词向量
			
 
				+    union_word_root = merge_word_root(a_word_root, b_word_root)
			
 
				+
			
 
				+    # 生成词向量
			
 
				+    a_vector, b_vector = gen_word_vector(a_word, b_word, union_word_root)
			
 
				+
			
 
				+    # 词向量相乘求和
			
 
				+    ab_vector_multi = vector_multi(a_vector, b_vector)
			
 
				+
			
 
				+    # 向量平方求和
			
 
				+    a_vector_squar_sum = vector_square_sum(a_vector)
			
 
				+    b_vector_squar_sum = vector_square_sum(b_vector)
			
 
				+
			
 
				+    cos_val = vector_cos(ab_vector_multi, a_vector_squar_sum, b_vector_squar_sum)
			
 
				+
			
 
				+    return cos_val
			
 
				+
			
 
				+
			
 
				+# with open(DATA_FILE, "r", encoding="UTF-8") as f:
			
 
				+#     lines = f.readlines()
			
 
				+#     for line in lines[:1000000]:
			
 
				+#         line = line.replace("\n", "")
			
 
				+#         word_root = cut_word(line)
			
 
				+#         word_dict[line]=word_root
			
 
				+
			
 
				+# key_list = list(word_dict.keys())
			
 
				+# for i, a_key in enumerate(key_list[:-1]):
			
 
				+#     for j, b_key in  enumerate(key_list[i+1:]):
			
 
				+#         if j % 100000 == 0 :
			
 
				+#             print("正在处理：%d, %d" % (i, j))
			
 
				+#         cos_val = cal_cos(a_key, b_key)
			
 
				+#         if cos_val > 0 :
			
 
				+#             print("%s 与 %s 的余弦值：%d " % (a_key, b_key, cos_val))
			
 
				+
			
 
				+
			
 
				+
			
 
				+# a_word = "腋下长了一个小疙瘩是什么东西"
			
 
				+# b_word = "什么东西吃蟑螂(四个字)"
			
 
				+# cos_val = cal_cos(a_word, b_word)
			
 
				+# print(cos_val)
			
 
				+# print("的余弦值：%f " % ( cos_val))
			
 
				+# print(cut_word(b_word))
			
--- a/cut.py
+++ b/cut.py
@@ -0,0 +1,95 @@
 
				+# -*- coding:utf-8 -*-
			
 
				+
			
 
				+import os
			
 
				+import csv
			
 
				+import jieba
			
 
				+import pandas as pd
			
 
				+
			
 
				+ENCODING_CHARSET = "UTF-8"
			
 
				+
			
 
				+DATA_KEYWORD_FILE = "E:\Download\长尾关键词\什么长尾词\什么长尾词_1655457938_utf8.csv"
			
 
				+CUT_OUTPUT_FILE = "./cut_out.csv"
			
 
				+
			
 
				+def cutWord(origFile, destFile):
			
 
				+
			
 
				+    print("开始处理")
			
 
				+
			
 
				+    if not os.path.exists(origFile):
			
 
				+        raise Exception("源文件不存在")
			
 
				+
			
 
				+    key_dict = {}
			
 
				+
			
 
				+    print("执行分词操作并进行词频统计")
			
 
				+
			
 
				+    # 分词并统计词频
			
 
				+    with open(DATA_KEYWORD_FILE, "r", encoding=ENCODING_CHARSET) as f:
			
 
				+        lines = f.readlines()
			
 
				+        for item in lines[2:]:
			
 
				+        # for item in f:
			
 
				+            longTailKey = item.split(",")[0]
			
 
				+            cutWord = jieba.cut_for_search(longTailKey)
			
 
				+            for word in cutWord:
			
 
				+                if word in key_dict:
			
 
				+                    key_dict[word] = key_dict[word] + 1
			
 
				+                else:
			
 
				+                    key_dict[word] = 1
			
 
				+
			
 
				+    print("根据词频进行倒序排列")
			
 
				+
			
 
				+    # 根据词频倒序排列
			
 
				+    sorted_key_dict = sorted(key_dict.items(), key=lambda x: x[1], reverse=True)
			
 
				+
			
 
				+    print("把结果写入到 %s 文件中" % CUT_OUTPUT_FILE)
			
 
				+
			
 
				+    # # 写入到csv文件
			
 
				+    with open(CUT_OUTPUT_FILE, "w", newline='', encoding=ENCODING_CHARSET) as csvFile:
			
 
				+        writer = csv.writer(csvFile)
			
 
				+        for rowItem in sorted_key_dict:
			
 
				+            writer.writerow(rowItem)
			
 
				+    
			
 
				+    print("处理结束")
			
 
				+
			
 
				+ORIG_FILE = "./cut_out.csv"
			
 
				+DEST_FILE = "./cut_out_filter.csv"
			
 
				+STOP_WORD_DIR = "./data/stopwords"
			
 
				+
			
 
				+def filterStopWord() :
			
 
				+    print("导入分词结果")
			
 
				+    df = pd.read_csv(ORIG_FILE, names=['key','count'])
			
 
				+
			
 
				+    # 导入停用词
			
 
				+    print("导入停用词")
			
 
				+
			
 
				+    stop_word = [];
			
 
				+
			
 
				+    stop_word_files = os.listdir(STOP_WORD_DIR)
			
 
				+    for file in stop_word_files:
			
 
				+        stop_word_file = os.path.join(STOP_WORD_DIR, file)
			
 
				+        with open(stop_word_file, encoding=ENCODING_CHARSET) as f:
			
 
				+            for item in f:
			
 
				+                stop_word.append(item.replace("\n",""))
			
 
				+    print("去重前，停用词数量：", len(stop_word))
			
 
				+    stop_word = list(set(stop_word))
			
 
				+    print("去重后，停用词数量：", len(stop_word))
			
 
				+
			
 
				+    # 过滤停用词
			
 
				+    print("过滤停用词")
			
 
				+    print("过滤前，总分词数量：%d" % len(df))
			
 
				+    df = df[df.apply(lambda row : row['key'] not in stop_word, axis=1)]
			
 
				+    print("过滤后，总分词数量：%d" % len(df))
			
 
				+
			
 
				+    print("大于1000的数量：", df[df['count'] > 1000].count().key)
			
 
				+    print("大于500的数量：", df[df['count'] > 500].count().key)
			
 
				+    print("大于400的数量：", df[df['count'] > 400].count().key)
			
 
				+    print("大于300的数量：", df[df['count'] > 300].count().key)
			
 
				+    print("大于250的数量：", df[df['count'] > 250].count().key)
			
 
				+    print("大于100的数量：", df[df['count'] > 100].count().key)
			
 
				+
			
 
				+    # 导出过滤后的数据，不要表头和行号
			
 
				+    print("导出过滤后的结果")
			
 
				+    df.to_csv(DEST_FILE, header=False, index=False)
			
 
				+
			
 
				+
			
 
				+cutWord(DATA_KEYWORD_FILE, CUT_OUTPUT_FILE)
			
 
				+filterStopWord()
			
 
				+
			
--- a/cut_multiprocess.py
+++ b/cut_multiprocess.py
@@ -0,0 +1,111 @@
 
				+# -*- coding:utf-8 -*-
			
 
				+
			
 
				+import os
			
 
				+import math
			
 
				+import pickle
			
 
				+import jieba
			
 
				+from multiprocessing import Process, Manager
			
 
				+
			
 
				+# 处理进程数量
			
 
				+PROCESS_NUM = 5
			
 
				+# 保存间隔（多久保存一次）
			
 
				+SAVE_INTERNAL = 100000
			
 
				+# 配置文件路径
			
 
				+CONFIG_PATH = "./cut_config_%d.pkl"
			
 
				+# 待处理的数据文件路径
			
 
				+DATA_FILE = './merge.txt'
			
 
				+
			
 
				+# 处理进程容器
			
 
				+process_list = []
			
 
				+# 配置文件容器
			
 
				+config_list = []
			
 
				+
			
 
				+
			
 
				+def save_config(config_path, config_obj):
			
 
				+    """
			
 
				+    保存配置文件
			
 
				+    """
			
 
				+    with open(config_path, "wb") as f:
			
 
				+        pickle.dump(config_obj, f)
			
 
				+
			
 
				+
			
 
				+def load_config(config_path):
			
 
				+    """
			
 
				+    加载配置文件
			
 
				+    """
			
 
				+    with open(config_path, "rb") as f:
			
 
				+        return pickle.load(f)
			
 
				+
			
 
				+def cut_word(word):
			
 
				+    """
			
 
				+    分词
			
 
				+    """
			
 
				+    word_root = jieba.cut_for_search(word)
			
 
				+    return list(word_root)
			
 
				+
			
 
				+def multiprocess_cut_word(process_name, config_path, cut_config):
			
 
				+
			
 
				+    """
			
 
				+    多进程进行分词处理
			
 
				+    """
			
 
				+
			
 
				+    print('进程：%s -> 分词处理开始' % process_name)
			
 
				+
			
 
				+    if os.path.exists(config_path) :
			
 
				+        cut_config = load_config(config_path)
			
 
				+        print("进程：%s -> 进断点恢复 当前状态：%s，开始处理位置：%d" % (process_name, cut_config["state"], cut_config["current_pos"]))
			
 
				+
			
 
				+    if cut_config['state'] == 'run':
			
 
				+        with open(DATA_FILE, "r", encoding="UTF-8") as f:
			
 
				+            lines = f.readlines()
			
 
				+            lines = lines[cut_config['current_pos']:cut_config['end_pos']]
			
 
				+            print("进程：%s ->剩余待处理数量：%d" % (process_name, len(lines)))
			
 
				+            for i, line in enumerate(lines):
			
 
				+                line = line.replace("\n", "")
			
 
				+                word_root = cut_word(line)
			
 
				+                cut_config["word_dict"][line]=word_root
			
 
				+
			
 
				+                if i > 0 and i % SAVE_INTERNAL == 0:
			
 
				+                    cut_config["current_pos"] = cut_config["current_pos"] + SAVE_INTERNAL
			
 
				+                    print("进程：%s -> 保存位置 当前状态：%s，开始处理位置：%d" % (process_name, cut_config["state"], cut_config["current_pos"]))
			
 
				+                    save_config(config_path, cut_config)
			
 
				+            
			
 
				+            cut_config["state"] = "end"
			
 
				+            save_config(config_path, cut_config)
			
 
				+
			
 
				+            print('进程：%s -> 分词处理结束' % process_name)
			
 
				+    else :
			
 
				+        print('进程：%s -> 断点恢复 分词处理结束' % process_name)
			
 
				+
			
 
				+def main():
			
 
				+    with open(DATA_FILE, "r", encoding="UTF-8") as f:
			
 
				+        lines = f.readlines()
			
 
				+        total_len = len(lines)
			
 
				+        count = math.ceil(total_len / PROCESS_NUM)
			
 
				+        print("总数量：%d, 数量区间：%d" % (total_len, count))
			
 
				+        for i in range(PROCESS_NUM):
			
 
				+            start_pos = i * count
			
 
				+            end_pos = i * count + count
			
 
				+            if end_pos >= total_len :
			
 
				+                end_pos = -1
			
 
				+            cut_config = {
			
 
				+                "state": "run",
			
 
				+                "start_pos": start_pos,
			
 
				+                "current_pos": start_pos,
			
 
				+                "end_pos": end_pos,
			
 
				+                "word_dict": {}
			
 
				+            }
			
 
				+            config_list.append(cut_config)
			
 
				+
			
 
				+    print("配置", config_list)
			
 
				+
			
 
				+    for i, config in enumerate(config_list):
			
 
				+        p = Process(target=multiprocess_cut_word, args=("进程-%d" % i, CONFIG_PATH % i, config))
			
 
				+        p.start()
			
 
				+        process_list.append(p)
			
 
				+
			
 
				+    for p in process_list:
			
 
				+        p.join()
			
 
				+
			
 
				+if __name__ == '__main__':
			
 
				+    main()
			
--- a/data/stopwords/baidu_stopwords.txt
+++ b/data/stopwords/baidu_stopwords.txt
@@ -0,0 +1,1396 @@
 
				+--
			
 
				+?
			
 
				+“
			
 
				+”
			
 
				+》
			
 
				+－－
			
 
				+able
			
 
				+about
			
 
				+above
			
 
				+according
			
 
				+accordingly
			
 
				+across
			
 
				+actually
			
 
				+after
			
 
				+afterwards
			
 
				+again
			
 
				+against
			
 
				+ain't
			
 
				+all
			
 
				+allow
			
 
				+allows
			
 
				+almost
			
 
				+alone
			
 
				+along
			
 
				+already
			
 
				+also
			
 
				+although
			
 
				+always
			
 
				+am
			
 
				+among
			
 
				+amongst
			
 
				+an
			
 
				+and
			
 
				+another
			
 
				+any
			
 
				+anybody
			
 
				+anyhow
			
 
				+anyone
			
 
				+anything
			
 
				+anyway
			
 
				+anyways
			
 
				+anywhere
			
 
				+apart
			
 
				+appear
			
 
				+appreciate
			
 
				+appropriate
			
 
				+are
			
 
				+aren't
			
 
				+around
			
 
				+as
			
 
				+a's
			
 
				+aside
			
 
				+ask
			
 
				+asking
			
 
				+associated
			
 
				+at
			
 
				+available
			
 
				+away
			
 
				+awfully
			
 
				+be
			
 
				+became
			
 
				+because
			
 
				+become
			
 
				+becomes
			
 
				+becoming
			
 
				+been
			
 
				+before
			
 
				+beforehand
			
 
				+behind
			
 
				+being
			
 
				+believe
			
 
				+below
			
 
				+beside
			
 
				+besides
			
 
				+best
			
 
				+better
			
 
				+between
			
 
				+beyond
			
 
				+both
			
 
				+brief
			
 
				+but
			
 
				+by
			
 
				+came
			
 
				+can
			
 
				+cannot
			
 
				+cant
			
 
				+can't
			
 
				+cause
			
 
				+causes
			
 
				+certain
			
 
				+certainly
			
 
				+changes
			
 
				+clearly
			
 
				+c'mon
			
 
				+co
			
 
				+com
			
 
				+come
			
 
				+comes
			
 
				+concerning
			
 
				+consequently
			
 
				+consider
			
 
				+considering
			
 
				+contain
			
 
				+containing
			
 
				+contains
			
 
				+corresponding
			
 
				+could
			
 
				+couldn't
			
 
				+course
			
 
				+c's
			
 
				+currently
			
 
				+definitely
			
 
				+described
			
 
				+despite
			
 
				+did
			
 
				+didn't
			
 
				+different
			
 
				+do
			
 
				+does
			
 
				+doesn't
			
 
				+doing
			
 
				+done
			
 
				+don't
			
 
				+down
			
 
				+downwards
			
 
				+during
			
 
				+each
			
 
				+edu
			
 
				+eg
			
 
				+eight
			
 
				+either
			
 
				+else
			
 
				+elsewhere
			
 
				+enough
			
 
				+entirely
			
 
				+especially
			
 
				+et
			
 
				+etc
			
 
				+even
			
 
				+ever
			
 
				+every
			
 
				+everybody
			
 
				+everyone
			
 
				+everything
			
 
				+everywhere
			
 
				+ex
			
 
				+exactly
			
 
				+example
			
 
				+except
			
 
				+far
			
 
				+few
			
 
				+fifth
			
 
				+first
			
 
				+five
			
 
				+followed
			
 
				+following
			
 
				+follows
			
 
				+for
			
 
				+former
			
 
				+formerly
			
 
				+forth
			
 
				+four
			
 
				+from
			
 
				+further
			
 
				+furthermore
			
 
				+get
			
 
				+gets
			
 
				+getting
			
 
				+given
			
 
				+gives
			
 
				+go
			
 
				+goes
			
 
				+going
			
 
				+gone
			
 
				+got
			
 
				+gotten
			
 
				+greetings
			
 
				+had
			
 
				+hadn't
			
 
				+happens
			
 
				+hardly
			
 
				+has
			
 
				+hasn't
			
 
				+have
			
 
				+haven't
			
 
				+having
			
 
				+he
			
 
				+hello
			
 
				+help
			
 
				+hence
			
 
				+her
			
 
				+here
			
 
				+hereafter
			
 
				+hereby
			
 
				+herein
			
 
				+here's
			
 
				+hereupon
			
 
				+hers
			
 
				+herself
			
 
				+he's
			
 
				+hi
			
 
				+him
			
 
				+himself
			
 
				+his
			
 
				+hither
			
 
				+hopefully
			
 
				+how
			
 
				+howbeit
			
 
				+however
			
 
				+i'd
			
 
				+ie
			
 
				+if
			
 
				+ignored
			
 
				+i'll
			
 
				+i'm
			
 
				+immediate
			
 
				+in
			
 
				+inasmuch
			
 
				+inc
			
 
				+indeed
			
 
				+indicate
			
 
				+indicated
			
 
				+indicates
			
 
				+inner
			
 
				+insofar
			
 
				+instead
			
 
				+into
			
 
				+inward
			
 
				+is
			
 
				+isn't
			
 
				+it
			
 
				+it'd
			
 
				+it'll
			
 
				+its
			
 
				+it's
			
 
				+itself
			
 
				+i've
			
 
				+just
			
 
				+keep
			
 
				+keeps
			
 
				+kept
			
 
				+know
			
 
				+known
			
 
				+knows
			
 
				+last
			
 
				+lately
			
 
				+later
			
 
				+latter
			
 
				+latterly
			
 
				+least
			
 
				+less
			
 
				+lest
			
 
				+let
			
 
				+let's
			
 
				+like
			
 
				+liked
			
 
				+likely
			
 
				+little
			
 
				+look
			
 
				+looking
			
 
				+looks
			
 
				+ltd
			
 
				+mainly
			
 
				+many
			
 
				+may
			
 
				+maybe
			
 
				+me
			
 
				+mean
			
 
				+meanwhile
			
 
				+merely
			
 
				+might
			
 
				+more
			
 
				+moreover
			
 
				+most
			
 
				+mostly
			
 
				+much
			
 
				+must
			
 
				+my
			
 
				+myself
			
 
				+name
			
 
				+namely
			
 
				+nd
			
 
				+near
			
 
				+nearly
			
 
				+necessary
			
 
				+need
			
 
				+needs
			
 
				+neither
			
 
				+never
			
 
				+nevertheless
			
 
				+new
			
 
				+next
			
 
				+nine
			
 
				+no
			
 
				+nobody
			
 
				+non
			
 
				+none
			
 
				+noone
			
 
				+nor
			
 
				+normally
			
 
				+not
			
 
				+nothing
			
 
				+novel
			
 
				+now
			
 
				+nowhere
			
 
				+obviously
			
 
				+of
			
 
				+off
			
 
				+often
			
 
				+oh
			
 
				+ok
			
 
				+okay
			
 
				+old
			
 
				+on
			
 
				+once
			
 
				+one
			
 
				+ones
			
 
				+only
			
 
				+onto
			
 
				+or
			
 
				+other
			
 
				+others
			
 
				+otherwise
			
 
				+ought
			
 
				+our
			
 
				+ours
			
 
				+ourselves
			
 
				+out
			
 
				+outside
			
 
				+over
			
 
				+overall
			
 
				+own
			
 
				+particular
			
 
				+particularly
			
 
				+per
			
 
				+perhaps
			
 
				+placed
			
 
				+please
			
 
				+plus
			
 
				+possible
			
 
				+presumably
			
 
				+probably
			
 
				+provides
			
 
				+que
			
 
				+quite
			
 
				+qv
			
 
				+rather
			
 
				+rd
			
 
				+re
			
 
				+really
			
 
				+reasonably
			
 
				+regarding
			
 
				+regardless
			
 
				+regards
			
 
				+relatively
			
 
				+respectively
			
 
				+right
			
 
				+said
			
 
				+same
			
 
				+saw
			
 
				+say
			
 
				+saying
			
 
				+says
			
 
				+second
			
 
				+secondly
			
 
				+see
			
 
				+seeing
			
 
				+seem
			
 
				+seemed
			
 
				+seeming
			
 
				+seems
			
 
				+seen
			
 
				+self
			
 
				+selves
			
 
				+sensible
			
 
				+sent
			
 
				+serious
			
 
				+seriously
			
 
				+seven
			
 
				+several
			
 
				+shall
			
 
				+she
			
 
				+should
			
 
				+shouldn't
			
 
				+since
			
 
				+six
			
 
				+so
			
 
				+some
			
 
				+somebody
			
 
				+somehow
			
 
				+someone
			
 
				+something
			
 
				+sometime
			
 
				+sometimes
			
 
				+somewhat
			
 
				+somewhere
			
 
				+soon
			
 
				+sorry
			
 
				+specified
			
 
				+specify
			
 
				+specifying
			
 
				+still
			
 
				+sub
			
 
				+such
			
 
				+sup
			
 
				+sure
			
 
				+take
			
 
				+taken
			
 
				+tell
			
 
				+tends
			
 
				+th
			
 
				+than
			
 
				+thank
			
 
				+thanks
			
 
				+thanx
			
 
				+that
			
 
				+thats
			
 
				+that's
			
 
				+the
			
 
				+their
			
 
				+theirs
			
 
				+them
			
 
				+themselves
			
 
				+then
			
 
				+thence
			
 
				+there
			
 
				+thereafter
			
 
				+thereby
			
 
				+therefore
			
 
				+therein
			
 
				+theres
			
 
				+there's
			
 
				+thereupon
			
 
				+these
			
 
				+they
			
 
				+they'd
			
 
				+they'll
			
 
				+they're
			
 
				+they've
			
 
				+think
			
 
				+third
			
 
				+this
			
 
				+thorough
			
 
				+thoroughly
			
 
				+those
			
 
				+though
			
 
				+three
			
 
				+through
			
 
				+throughout
			
 
				+thru
			
 
				+thus
			
 
				+to
			
 
				+together
			
 
				+too
			
 
				+took
			
 
				+toward
			
 
				+towards
			
 
				+tried
			
 
				+tries
			
 
				+truly
			
 
				+try
			
 
				+trying
			
 
				+t's
			
 
				+twice
			
 
				+two
			
 
				+un
			
 
				+under
			
 
				+unfortunately
			
 
				+unless
			
 
				+unlikely
			
 
				+until
			
 
				+unto
			
 
				+up
			
 
				+upon
			
 
				+us
			
 
				+use
			
 
				+used
			
 
				+useful
			
 
				+uses
			
 
				+using
			
 
				+usually
			
 
				+value
			
 
				+various
			
 
				+very
			
 
				+via
			
 
				+viz
			
 
				+vs
			
 
				+want
			
 
				+wants
			
 
				+was
			
 
				+wasn't
			
 
				+way
			
 
				+we
			
 
				+we'd
			
 
				+welcome
			
 
				+well
			
 
				+we'll
			
 
				+went
			
 
				+were
			
 
				+we're
			
 
				+weren't
			
 
				+we've
			
 
				+what
			
 
				+whatever
			
 
				+what's
			
 
				+when
			
 
				+whence
			
 
				+whenever
			
 
				+where
			
 
				+whereafter
			
 
				+whereas
			
 
				+whereby
			
 
				+wherein
			
 
				+where's
			
 
				+whereupon
			
 
				+wherever
			
 
				+whether
			
 
				+which
			
 
				+while
			
 
				+whither
			
 
				+who
			
 
				+whoever
			
 
				+whole
			
 
				+whom
			
 
				+who's
			
 
				+whose
			
 
				+why
			
 
				+will
			
 
				+willing
			
 
				+wish
			
 
				+with
			
 
				+within
			
 
				+without
			
 
				+wonder
			
 
				+won't
			
 
				+would
			
 
				+wouldn't
			
 
				+yes
			
 
				+yet
			
 
				+you
			
 
				+you'd
			
 
				+you'll
			
 
				+your
			
 
				+you're
			
 
				+yours
			
 
				+yourself
			
 
				+yourselves
			
 
				+you've
			
 
				+zero
			
 
				+zt
			
 
				+ZT
			
 
				+zz
			
 
				+ZZ
			
 
				+一
			
 
				+一下
			
 
				+一些
			
 
				+一切
			
 
				+一则
			
 
				+一天
			
 
				+一定
			
 
				+一方面
			
 
				+一旦
			
 
				+一时
			
 
				+一来
			
 
				+一样
			
 
				+一次
			
 
				+一片
			
 
				+一直
			
 
				+一致
			
 
				+一般
			
 
				+一起
			
 
				+一边
			
 
				+一面
			
 
				+万一
			
 
				+上下
			
 
				+上升
			
 
				+上去
			
 
				+上来
			
 
				+上述
			
 
				+上面
			
 
				+下列
			
 
				+下去
			
 
				+下来
			
 
				+下面
			
 
				+不一
			
 
				+不久
			
 
				+不仅
			
 
				+不会
			
 
				+不但
			
 
				+不光
			
 
				+不单
			
 
				+不变
			
 
				+不只
			
 
				+不可
			
 
				+不同
			
 
				+不够
			
 
				+不如
			
 
				+不得
			
 
				+不怕
			
 
				+不惟
			
 
				+不成
			
 
				+不拘
			
 
				+不敢
			
 
				+不断
			
 
				+不是
			
 
				+不比
			
 
				+不然
			
 
				+不特
			
 
				+不独
			
 
				+不管
			
 
				+不能
			
 
				+不要
			
 
				+不论
			
 
				+不足
			
 
				+不过
			
 
				+不问
			
 
				+与
			
 
				+与其
			
 
				+与否
			
 
				+与此同时
			
 
				+专门
			
 
				+且
			
 
				+两者
			
 
				+严格
			
 
				+严重
			
 
				+个
			
 
				+个人
			
 
				+个别
			
 
				+中小
			
 
				+中间
			
 
				+丰富
			
 
				+临
			
 
				+为
			
 
				+为主
			
 
				+为了
			
 
				+为什么
			
 
				+为什麽
			
 
				+为何
			
 
				+为着
			
 
				+主张
			
 
				+主要
			
 
				+举行
			
 
				+乃
			
 
				+乃至
			
 
				+么
			
 
				+之
			
 
				+之一
			
 
				+之前
			
 
				+之后
			
 
				+之後
			
 
				+之所以
			
 
				+之类
			
 
				+乌乎
			
 
				+乎
			
 
				+乘
			
 
				+也
			
 
				+也好
			
 
				+也是
			
 
				+也罢
			
 
				+了
			
 
				+了解
			
 
				+争取
			
 
				+于
			
 
				+于是
			
 
				+于是乎
			
 
				+云云
			
 
				+互相
			
 
				+产生
			
 
				+人们
			
 
				+人家
			
 
				+什么
			
 
				+什么样
			
 
				+什麽
			
 
				+今后
			
 
				+今天
			
 
				+今年
			
 
				+今後
			
 
				+仍然
			
 
				+从
			
 
				+从事
			
 
				+从而
			
 
				+他
			
 
				+他人
			
 
				+他们
			
 
				+他的
			
 
				+代替
			
 
				+以
			
 
				+以上
			
 
				+以下
			
 
				+以为
			
 
				+以便
			
 
				+以免
			
 
				+以前
			
 
				+以及
			
 
				+以后
			
 
				+以外
			
 
				+以後
			
 
				+以来
			
 
				+以至
			
 
				+以至于
			
 
				+以致
			
 
				+们
			
 
				+任
			
 
				+任何
			
 
				+任凭
			
 
				+任务
			
 
				+企图
			
 
				+伟大
			
 
				+似乎
			
 
				+似的
			
 
				+但
			
 
				+但是
			
 
				+何
			
 
				+何况
			
 
				+何处
			
 
				+何时
			
 
				+作为
			
 
				+你
			
 
				+你们
			
 
				+你的
			
 
				+使得
			
 
				+使用
			
 
				+例如
			
 
				+依
			
 
				+依照
			
 
				+依靠
			
 
				+促进
			
 
				+保持
			
 
				+俺
			
 
				+俺们
			
 
				+倘
			
 
				+倘使
			
 
				+倘或
			
 
				+倘然
			
 
				+倘若
			
 
				+假使
			
 
				+假如
			
 
				+假若
			
 
				+做到
			
 
				+像
			
 
				+允许
			
 
				+充分
			
 
				+先后
			
 
				+先後
			
 
				+先生
			
 
				+全部
			
 
				+全面
			
 
				+兮
			
 
				+共同
			
 
				+关于
			
 
				+其
			
 
				+其一
			
 
				+其中
			
 
				+其二
			
 
				+其他
			
 
				+其余
			
 
				+其它
			
 
				+其实
			
 
				+其次
			
 
				+具体
			
 
				+具体地说
			
 
				+具体说来
			
 
				+具有
			
 
				+再者
			
 
				+再说
			
 
				+冒
			
 
				+冲
			
 
				+决定
			
 
				+况且
			
 
				+准备
			
 
				+几
			
 
				+几乎
			
 
				+几时
			
 
				+凭
			
 
				+凭借
			
 
				+出去
			
 
				+出来
			
 
				+出现
			
 
				+分别
			
 
				+则
			
 
				+别
			
 
				+别的
			
 
				+别说
			
 
				+到
			
 
				+前后
			
 
				+前者
			
 
				+前进
			
 
				+前面
			
 
				+加之
			
 
				+加以
			
 
				+加入
			
 
				+加强
			
 
				+十分
			
 
				+即
			
 
				+即令
			
 
				+即使
			
 
				+即便
			
 
				+即或
			
 
				+即若
			
 
				+却不
			
 
				+原来
			
 
				+又
			
 
				+及
			
 
				+及其
			
 
				+及时
			
 
				+及至
			
 
				+双方
			
 
				+反之
			
 
				+反应
			
 
				+反映
			
 
				+反过来
			
 
				+反过来说
			
 
				+取得
			
 
				+受到
			
 
				+变成
			
 
				+另
			
 
				+另一方面
			
 
				+另外
			
 
				+只是
			
 
				+只有
			
 
				+只要
			
 
				+只限
			
 
				+叫
			
 
				+叫做
			
 
				+召开
			
 
				+叮咚
			
 
				+可
			
 
				+可以
			
 
				+可是
			
 
				+可能
			
 
				+可见
			
 
				+各
			
 
				+各个
			
 
				+各人
			
 
				+各位
			
 
				+各地
			
 
				+各种
			
 
				+各级
			
 
				+各自
			
 
				+合理
			
 
				+同
			
 
				+同一
			
 
				+同时
			
 
				+同样
			
 
				+后来
			
 
				+后面
			
 
				+向
			
 
				+向着
			
 
				+吓
			
 
				+吗
			
 
				+否则
			
 
				+吧
			
 
				+吧哒
			
 
				+吱
			
 
				+呀
			
 
				+呃
			
 
				+呕
			
 
				+呗
			
 
				+呜
			
 
				+呜呼
			
 
				+呢
			
 
				+周围
			
 
				+呵
			
 
				+呸
			
 
				+呼哧
			
 
				+咋
			
 
				+和
			
 
				+咚
			
 
				+咦
			
 
				+咱
			
 
				+咱们
			
 
				+咳
			
 
				+哇
			
 
				+哈
			
 
				+哈哈
			
 
				+哉
			
 
				+哎
			
 
				+哎呀
			
 
				+哎哟
			
 
				+哗
			
 
				+哟
			
 
				+哦
			
 
				+哩
			
 
				+哪
			
 
				+哪个
			
 
				+哪些
			
 
				+哪儿
			
 
				+哪天
			
 
				+哪年
			
 
				+哪怕
			
 
				+哪样
			
 
				+哪边
			
 
				+哪里
			
 
				+哼
			
 
				+哼唷
			
 
				+唉
			
 
				+啊
			
 
				+啐
			
 
				+啥
			
 
				+啦
			
 
				+啪达
			
 
				+喂
			
 
				+喏
			
 
				+喔唷
			
 
				+嗡嗡
			
 
				+嗬
			
 
				+嗯
			
 
				+嗳
			
 
				+嘎
			
 
				+嘎登
			
 
				+嘘
			
 
				+嘛
			
 
				+嘻
			
 
				+嘿
			
 
				+因
			
 
				+因为
			
 
				+因此
			
 
				+因而
			
 
				+固然
			
 
				+在
			
 
				+在下
			
 
				+地
			
 
				+坚决
			
 
				+坚持
			
 
				+基本
			
 
				+处理
			
 
				+复杂
			
 
				+多
			
 
				+多少
			
 
				+多数
			
 
				+多次
			
 
				+大力
			
 
				+大多数
			
 
				+大大
			
 
				+大家
			
 
				+大批
			
 
				+大约
			
 
				+大量
			
 
				+失去
			
 
				+她
			
 
				+她们
			
 
				+她的
			
 
				+好的
			
 
				+好象
			
 
				+如
			
 
				+如上所述
			
 
				+如下
			
 
				+如何
			
 
				+如其
			
 
				+如果
			
 
				+如此
			
 
				+如若
			
 
				+存在
			
 
				+宁
			
 
				+宁可
			
 
				+宁愿
			
 
				+宁肯
			
 
				+它
			
 
				+它们
			
 
				+它们的
			
 
				+它的
			
 
				+安全
			
 
				+完全
			
 
				+完成
			
 
				+实现
			
 
				+实际
			
 
				+宣布
			
 
				+容易
			
 
				+密切
			
 
				+对
			
 
				+对于
			
 
				+对应
			
 
				+将
			
 
				+少数
			
 
				+尔后
			
 
				+尚且
			
 
				+尤其
			
 
				+就
			
 
				+就是
			
 
				+就是说
			
 
				+尽
			
 
				+尽管
			
 
				+属于
			
 
				+岂但
			
 
				+左右
			
 
				+巨大
			
 
				+巩固
			
 
				+己
			
 
				+已经
			
 
				+帮助
			
 
				+常常
			
 
				+并
			
 
				+并不
			
 
				+并不是
			
 
				+并且
			
 
				+并没有
			
 
				+广大
			
 
				+广泛
			
 
				+应当
			
 
				+应用
			
 
				+应该
			
 
				+开外
			
 
				+开始
			
 
				+开展
			
 
				+引起
			
 
				+强烈
			
 
				+强调
			
 
				+归
			
 
				+当
			
 
				+当前
			
 
				+当时
			
 
				+当然
			
 
				+当着
			
 
				+形成
			
 
				+彻底
			
 
				+彼
			
 
				+彼此
			
 
				+往
			
 
				+往往
			
 
				+待
			
 
				+後来
			
 
				+後面
			
 
				+得
			
 
				+得出
			
 
				+得到
			
 
				+心里
			
 
				+必然
			
 
				+必要
			
 
				+必须
			
 
				+怎
			
 
				+怎么
			
 
				+怎么办
			
 
				+怎么样
			
 
				+怎样
			
 
				+怎麽
			
 
				+总之
			
 
				+总是
			
 
				+总的来看
			
 
				+总的来说
			
 
				+总的说来
			
 
				+总结
			
 
				+总而言之
			
 
				+恰恰相反
			
 
				+您
			
 
				+意思
			
 
				+愿意
			
 
				+慢说
			
 
				+成为
			
 
				+我
			
 
				+我们
			
 
				+我的
			
 
				+或
			
 
				+或是
			
 
				+或者
			
 
				+战斗
			
 
				+所
			
 
				+所以
			
 
				+所有
			
 
				+所谓
			
 
				+打
			
 
				+扩大
			
 
				+把
			
 
				+抑或
			
 
				+拿
			
 
				+按
			
 
				+按照
			
 
				+换句话说
			
 
				+换言之
			
 
				+据
			
 
				+掌握
			
 
				+接着
			
 
				+接著
			
 
				+故
			
 
				+故此
			
 
				+整个
			
 
				+方便
			
 
				+方面
			
 
				+旁人
			
 
				+无宁
			
 
				+无法
			
 
				+无论
			
 
				+既
			
 
				+既是
			
 
				+既然
			
 
				+时候
			
 
				+明显
			
 
				+明确
			
 
				+是
			
 
				+是否
			
 
				+是的
			
 
				+显然
			
 
				+显著
			
 
				+普通
			
 
				+普遍
			
 
				+更加
			
 
				+曾经
			
 
				+替
			
 
				+最后
			
 
				+最大
			
 
				+最好
			
 
				+最後
			
 
				+最近
			
 
				+最高
			
 
				+有
			
 
				+有些
			
 
				+有关
			
 
				+有利
			
 
				+有力
			
 
				+有所
			
 
				+有效
			
 
				+有时
			
 
				+有点
			
 
				+有的
			
 
				+有着
			
 
				+有著
			
 
				+望
			
 
				+朝
			
 
				+朝着
			
 
				+本
			
 
				+本着
			
 
				+来
			
 
				+来着
			
 
				+极了
			
 
				+构成
			
 
				+果然
			
 
				+果真
			
 
				+某
			
 
				+某个
			
 
				+某些
			
 
				+根据
			
 
				+根本
			
 
				+欢迎
			
 
				+正在
			
 
				+正如
			
 
				+正常
			
 
				+此
			
 
				+此外
			
 
				+此时
			
 
				+此间
			
 
				+毋宁
			
 
				+每
			
 
				+每个
			
 
				+每天
			
 
				+每年
			
 
				+每当
			
 
				+比
			
 
				+比如
			
 
				+比方
			
 
				+比较
			
 
				+毫不
			
 
				+没有
			
 
				+沿
			
 
				+沿着
			
 
				+注意
			
 
				+深入
			
 
				+清楚
			
 
				+满足
			
 
				+漫说
			
 
				+焉
			
 
				+然则
			
 
				+然后
			
 
				+然後
			
 
				+然而
			
 
				+照
			
 
				+照着
			
 
				+特别是
			
 
				+特殊
			
 
				+特点
			
 
				+现代
			
 
				+现在
			
 
				+甚么
			
 
				+甚而
			
 
				+甚至
			
 
				+用
			
 
				+由
			
 
				+由于
			
 
				+由此可见
			
 
				+的
			
 
				+的话
			
 
				+目前
			
 
				+直到
			
 
				+直接
			
 
				+相似
			
 
				+相信
			
 
				+相反
			
 
				+相同
			
 
				+相对
			
 
				+相对而言
			
 
				+相应
			
 
				+相当
			
 
				+相等
			
 
				+省得
			
 
				+看出
			
 
				+看到
			
 
				+看来
			
 
				+看看
			
 
				+看见
			
 
				+真是
			
 
				+真正
			
 
				+着
			
 
				+着呢
			
 
				+矣
			
 
				+知道
			
 
				+确定
			
 
				+离
			
 
				+积极
			
 
				+移动
			
 
				+突出
			
 
				+突然
			
 
				+立即
			
 
				+第
			
 
				+等
			
 
				+等等
			
 
				+管
			
 
				+紧接着
			
 
				+纵
			
 
				+纵令
			
 
				+纵使
			
 
				+纵然
			
 
				+练习
			
 
				+组成
			
 
				+经
			
 
				+经常
			
 
				+经过
			
 
				+结合
			
 
				+结果
			
 
				+给
			
 
				+绝对
			
 
				+继续
			
 
				+继而
			
 
				+维持
			
 
				+综上所述
			
 
				+罢了
			
 
				+考虑
			
 
				+者
			
 
				+而
			
 
				+而且
			
 
				+而况
			
 
				+而外
			
 
				+而已
			
 
				+而是
			
 
				+而言
			
 
				+联系
			
 
				+能
			
 
				+能否
			
 
				+能够
			
 
				+腾
			
 
				+自
			
 
				+自个儿
			
 
				+自从
			
 
				+自各儿
			
 
				+自家
			
 
				+自己
			
 
				+自身
			
 
				+至
			
 
				+至于
			
 
				+良好
			
 
				+若
			
 
				+若是
			
 
				+若非
			
 
				+范围
			
 
				+莫若
			
 
				+获得
			
 
				+虽
			
 
				+虽则
			
 
				+虽然
			
 
				+虽说
			
 
				+行为
			
 
				+行动
			
 
				+表明
			
 
				+表示
			
 
				+被
			
 
				+要
			
 
				+要不
			
 
				+要不是
			
 
				+要不然
			
 
				+要么
			
 
				+要是
			
 
				+要求
			
 
				+规定
			
 
				+觉得
			
 
				+认为
			
 
				+认真
			
 
				+认识
			
 
				+让
			
 
				+许多
			
 
				+论
			
 
				+设使
			
 
				+设若
			
 
				+该
			
 
				+说明
			
 
				+诸位
			
 
				+谁
			
 
				+谁知
			
 
				+赶
			
 
				+起
			
 
				+起来
			
 
				+起见
			
 
				+趁
			
 
				+趁着
			
 
				+越是
			
 
				+跟
			
 
				+转动
			
 
				+转变
			
 
				+转贴
			
 
				+较
			
 
				+较之
			
 
				+边
			
 
				+达到
			
 
				+迅速
			
 
				+过
			
 
				+过去
			
 
				+过来
			
 
				+运用
			
 
				+还是
			
 
				+还有
			
 
				+这
			
 
				+这个
			
 
				+这么
			
 
				+这么些
			
 
				+这么样
			
 
				+这么点儿
			
 
				+这些
			
 
				+这会儿
			
 
				+这儿
			
 
				+这就是说
			
 
				+这时
			
 
				+这样
			
 
				+这点
			
 
				+这种
			
 
				+这边
			
 
				+这里
			
 
				+这麽
			
 
				+进入
			
 
				+进步
			
 
				+进而
			
 
				+进行
			
 
				+连
			
 
				+连同
			
 
				+适应
			
 
				+适当
			
 
				+适用
			
 
				+逐步
			
 
				+逐渐
			
 
				+通常
			
 
				+通过
			
 
				+造成
			
 
				+遇到
			
 
				+遭到
			
 
				+避免
			
 
				+那
			
 
				+那个
			
 
				+那么
			
 
				+那么些
			
 
				+那么样
			
 
				+那些
			
 
				+那会儿
			
 
				+那儿
			
 
				+那时
			
 
				+那样
			
 
				+那边
			
 
				+那里
			
 
				+那麽
			
 
				+部分
			
 
				+鄙人
			
 
				+采取
			
 
				+里面
			
 
				+重大
			
 
				+重新
			
 
				+重要
			
 
				+鉴于
			
 
				+问题
			
 
				+防止
			
 
				+阿
			
 
				+附近
			
 
				+限制
			
 
				+除
			
 
				+除了
			
 
				+除此之外
			
 
				+除非
			
 
				+随
			
 
				+随着
			
 
				+随著
			
 
				+集中
			
 
				+需要
			
 
				+非但
			
 
				+非常
			
 
				+非徒
			
 
				+靠
			
 
				+顺
			
 
				+顺着
			
 
				+首先
			
 
				+高兴
			
 
				+是不是
			
 
				+说说
			
 
				+ 
			
--- a/data/stopwords/cn_stopwords.txt
+++ b/data/stopwords/cn_stopwords.txt
@@ -0,0 +1,746 @@
 
				+$
			
 
				+0
			
 
				+1
			
 
				+2
			
 
				+3
			
 
				+4
			
 
				+5
			
 
				+6
			
 
				+7
			
 
				+8
			
 
				+9
			
 
				+?
			
 
				+_
			
 
				+“
			
 
				+”
			
 
				+、
			
 
				+。
			
 
				+《
			
 
				+》
			
 
				+一
			
 
				+一些
			
 
				+一何
			
 
				+一切
			
 
				+一则
			
 
				+一方面
			
 
				+一旦
			
 
				+一来
			
 
				+一样
			
 
				+一般
			
 
				+一转眼
			
 
				+万一
			
 
				+上
			
 
				+上下
			
 
				+下
			
 
				+不
			
 
				+不仅
			
 
				+不但
			
 
				+不光
			
 
				+不单
			
 
				+不只
			
 
				+不外乎
			
 
				+不如
			
 
				+不妨
			
 
				+不尽
			
 
				+不尽然
			
 
				+不得
			
 
				+不怕
			
 
				+不惟
			
 
				+不成
			
 
				+不拘
			
 
				+不料
			
 
				+不是
			
 
				+不比
			
 
				+不然
			
 
				+不特
			
 
				+不独
			
 
				+不管
			
 
				+不至于
			
 
				+不若
			
 
				+不论
			
 
				+不过
			
 
				+不问
			
 
				+与
			
 
				+与其
			
 
				+与其说
			
 
				+与否
			
 
				+与此同时
			
 
				+且
			
 
				+且不说
			
 
				+且说
			
 
				+两者
			
 
				+个
			
 
				+个别
			
 
				+临
			
 
				+为
			
 
				+为了
			
 
				+为什么
			
 
				+为何
			
 
				+为止
			
 
				+为此
			
 
				+为着
			
 
				+乃
			
 
				+乃至
			
 
				+乃至于
			
 
				+么
			
 
				+之
			
 
				+之一
			
 
				+之所以
			
 
				+之类
			
 
				+乌乎
			
 
				+乎
			
 
				+乘
			
 
				+也
			
 
				+也好
			
 
				+也罢
			
 
				+了
			
 
				+二来
			
 
				+于
			
 
				+于是
			
 
				+于是乎
			
 
				+云云
			
 
				+云尔
			
 
				+些
			
 
				+亦
			
 
				+人
			
 
				+人们
			
 
				+人家
			
 
				+什么
			
 
				+什么样
			
 
				+今
			
 
				+介于
			
 
				+仍
			
 
				+仍旧
			
 
				+从
			
 
				+从此
			
 
				+从而
			
 
				+他
			
 
				+他人
			
 
				+他们
			
 
				+以
			
 
				+以上
			
 
				+以为
			
 
				+以便
			
 
				+以免
			
 
				+以及
			
 
				+以故
			
 
				+以期
			
 
				+以来
			
 
				+以至
			
 
				+以至于
			
 
				+以致
			
 
				+们
			
 
				+任
			
 
				+任何
			
 
				+任凭
			
 
				+似的
			
 
				+但
			
 
				+但凡
			
 
				+但是
			
 
				+何
			
 
				+何以
			
 
				+何况
			
 
				+何处
			
 
				+何时
			
 
				+余外
			
 
				+作为
			
 
				+你
			
 
				+你们
			
 
				+使
			
 
				+使得
			
 
				+例如
			
 
				+依
			
 
				+依据
			
 
				+依照
			
 
				+便于
			
 
				+俺
			
 
				+俺们
			
 
				+倘
			
 
				+倘使
			
 
				+倘或
			
 
				+倘然
			
 
				+倘若
			
 
				+借
			
 
				+假使
			
 
				+假如
			
 
				+假若
			
 
				+傥然
			
 
				+像
			
 
				+儿
			
 
				+先不先
			
 
				+光是
			
 
				+全体
			
 
				+全部
			
 
				+兮
			
 
				+关于
			
 
				+其
			
 
				+其一
			
 
				+其中
			
 
				+其二
			
 
				+其他
			
 
				+其余
			
 
				+其它
			
 
				+其次
			
 
				+具体地说
			
 
				+具体说来
			
 
				+兼之
			
 
				+内
			
 
				+再
			
 
				+再其次
			
 
				+再则
			
 
				+再有
			
 
				+再者
			
 
				+再者说
			
 
				+再说
			
 
				+冒
			
 
				+冲
			
 
				+况且
			
 
				+几
			
 
				+几时
			
 
				+凡
			
 
				+凡是
			
 
				+凭
			
 
				+凭借
			
 
				+出于
			
 
				+出来
			
 
				+分别
			
 
				+则
			
 
				+则甚
			
 
				+别
			
 
				+别人
			
 
				+别处
			
 
				+别是
			
 
				+别的
			
 
				+别管
			
 
				+别说
			
 
				+到
			
 
				+前后
			
 
				+前此
			
 
				+前者
			
 
				+加之
			
 
				+加以
			
 
				+即
			
 
				+即令
			
 
				+即使
			
 
				+即便
			
 
				+即如
			
 
				+即或
			
 
				+即若
			
 
				+却
			
 
				+去
			
 
				+又
			
 
				+又及
			
 
				+及
			
 
				+及其
			
 
				+及至
			
 
				+反之
			
 
				+反而
			
 
				+反过来
			
 
				+反过来说
			
 
				+受到
			
 
				+另
			
 
				+另一方面
			
 
				+另外
			
 
				+另悉
			
 
				+只
			
 
				+只当
			
 
				+只怕
			
 
				+只是
			
 
				+只有
			
 
				+只消
			
 
				+只要
			
 
				+只限
			
 
				+叫
			
 
				+叮咚
			
 
				+可
			
 
				+可以
			
 
				+可是
			
 
				+可见
			
 
				+各
			
 
				+各个
			
 
				+各位
			
 
				+各种
			
 
				+各自
			
 
				+同
			
 
				+同时
			
 
				+后
			
 
				+后者
			
 
				+向
			
 
				+向使
			
 
				+向着
			
 
				+吓
			
 
				+吗
			
 
				+否则
			
 
				+吧
			
 
				+吧哒
			
 
				+吱
			
 
				+呀
			
 
				+呃
			
 
				+呕
			
 
				+呗
			
 
				+呜
			
 
				+呜呼
			
 
				+呢
			
 
				+呵
			
 
				+呵呵
			
 
				+呸
			
 
				+呼哧
			
 
				+咋
			
 
				+和
			
 
				+咚
			
 
				+咦
			
 
				+咧
			
 
				+咱
			
 
				+咱们
			
 
				+咳
			
 
				+哇
			
 
				+哈
			
 
				+哈哈
			
 
				+哉
			
 
				+哎
			
 
				+哎呀
			
 
				+哎哟
			
 
				+哗
			
 
				+哟
			
 
				+哦
			
 
				+哩
			
 
				+哪
			
 
				+哪个
			
 
				+哪些
			
 
				+哪儿
			
 
				+哪天
			
 
				+哪年
			
 
				+哪怕
			
 
				+哪样
			
 
				+哪边
			
 
				+哪里
			
 
				+哼
			
 
				+哼唷
			
 
				+唉
			
 
				+唯有
			
 
				+啊
			
 
				+啐
			
 
				+啥
			
 
				+啦
			
 
				+啪达
			
 
				+啷当
			
 
				+喂
			
 
				+喏
			
 
				+喔唷
			
 
				+喽
			
 
				+嗡
			
 
				+嗡嗡
			
 
				+嗬
			
 
				+嗯
			
 
				+嗳
			
 
				+嘎
			
 
				+嘎登
			
 
				+嘘
			
 
				+嘛
			
 
				+嘻
			
 
				+嘿
			
 
				+嘿嘿
			
 
				+因
			
 
				+因为
			
 
				+因了
			
 
				+因此
			
 
				+因着
			
 
				+因而
			
 
				+固然
			
 
				+在
			
 
				+在下
			
 
				+在于
			
 
				+地
			
 
				+基于
			
 
				+处在
			
 
				+多
			
 
				+多么
			
 
				+多少
			
 
				+大
			
 
				+大家
			
 
				+她
			
 
				+她们
			
 
				+好
			
 
				+如
			
 
				+如上
			
 
				+如上所述
			
 
				+如下
			
 
				+如何
			
 
				+如其
			
 
				+如同
			
 
				+如是
			
 
				+如果
			
 
				+如此
			
 
				+如若
			
 
				+始而
			
 
				+孰料
			
 
				+孰知
			
 
				+宁
			
 
				+宁可
			
 
				+宁愿
			
 
				+宁肯
			
 
				+它
			
 
				+它们
			
 
				+对
			
 
				+对于
			
 
				+对待
			
 
				+对方
			
 
				+对比
			
 
				+将
			
 
				+小
			
 
				+尔
			
 
				+尔后
			
 
				+尔尔
			
 
				+尚且
			
 
				+就
			
 
				+就是
			
 
				+就是了
			
 
				+就是说
			
 
				+就算
			
 
				+就要
			
 
				+尽
			
 
				+尽管
			
 
				+尽管如此
			
 
				+岂但
			
 
				+己
			
 
				+已
			
 
				+已矣
			
 
				+巴
			
 
				+巴巴
			
 
				+并
			
 
				+并且
			
 
				+并非
			
 
				+庶乎
			
 
				+庶几
			
 
				+开外
			
 
				+开始
			
 
				+归
			
 
				+归齐
			
 
				+当
			
 
				+当地
			
 
				+当然
			
 
				+当着
			
 
				+彼
			
 
				+彼时
			
 
				+彼此
			
 
				+往
			
 
				+待
			
 
				+很
			
 
				+得
			
 
				+得了
			
 
				+怎
			
 
				+怎么
			
 
				+怎么办
			
 
				+怎么样
			
 
				+怎奈
			
 
				+怎样
			
 
				+总之
			
 
				+总的来看
			
 
				+总的来说
			
 
				+总的说来
			
 
				+总而言之
			
 
				+恰恰相反
			
 
				+您
			
 
				+惟其
			
 
				+慢说
			
 
				+我
			
 
				+我们
			
 
				+或
			
 
				+或则
			
 
				+或是
			
 
				+或曰
			
 
				+或者
			
 
				+截至
			
 
				+所
			
 
				+所以
			
 
				+所在
			
 
				+所幸
			
 
				+所有
			
 
				+才
			
 
				+才能
			
 
				+打
			
 
				+打从
			
 
				+把
			
 
				+抑或
			
 
				+拿
			
 
				+按
			
 
				+按照
			
 
				+换句话说
			
 
				+换言之
			
 
				+据
			
 
				+据此
			
 
				+接着
			
 
				+故
			
 
				+故此
			
 
				+故而
			
 
				+旁人
			
 
				+无
			
 
				+无宁
			
 
				+无论
			
 
				+既
			
 
				+既往
			
 
				+既是
			
 
				+既然
			
 
				+时候
			
 
				+是
			
 
				+是以
			
 
				+是的
			
 
				+曾
			
 
				+替
			
 
				+替代
			
 
				+最
			
 
				+有
			
 
				+有些
			
 
				+有关
			
 
				+有及
			
 
				+有时
			
 
				+有的
			
 
				+望
			
 
				+朝
			
 
				+朝着
			
 
				+本
			
 
				+本人
			
 
				+本地
			
 
				+本着
			
 
				+本身
			
 
				+来
			
 
				+来着
			
 
				+来自
			
 
				+来说
			
 
				+极了
			
 
				+果然
			
 
				+果真
			
 
				+某
			
 
				+某个
			
 
				+某些
			
 
				+某某
			
 
				+根据
			
 
				+欤
			
 
				+正值
			
 
				+正如
			
 
				+正巧
			
 
				+正是
			
 
				+此
			
 
				+此地
			
 
				+此处
			
 
				+此外
			
 
				+此时
			
 
				+此次
			
 
				+此间
			
 
				+毋宁
			
 
				+每
			
 
				+每当
			
 
				+比
			
 
				+比及
			
 
				+比如
			
 
				+比方
			
 
				+没奈何
			
 
				+沿
			
 
				+沿着
			
 
				+漫说
			
 
				+焉
			
 
				+然则
			
 
				+然后
			
 
				+然而
			
 
				+照
			
 
				+照着
			
 
				+犹且
			
 
				+犹自
			
 
				+甚且
			
 
				+甚么
			
 
				+甚或
			
 
				+甚而
			
 
				+甚至
			
 
				+甚至于
			
 
				+用
			
 
				+用来
			
 
				+由
			
 
				+由于
			
 
				+由是
			
 
				+由此
			
 
				+由此可见
			
 
				+的
			
 
				+的确
			
 
				+的话
			
 
				+直到
			
 
				+相对而言
			
 
				+省得
			
 
				+看
			
 
				+眨眼
			
 
				+着
			
 
				+着呢
			
 
				+矣
			
 
				+矣乎
			
 
				+矣哉
			
 
				+离
			
 
				+竟而
			
 
				+第
			
 
				+等
			
 
				+等到
			
 
				+等等
			
 
				+简言之
			
 
				+管
			
 
				+类如
			
 
				+紧接着
			
 
				+纵
			
 
				+纵令
			
 
				+纵使
			
 
				+纵然
			
 
				+经
			
 
				+经过
			
 
				+结果
			
 
				+给
			
 
				+继之
			
 
				+继后
			
 
				+继而
			
 
				+综上所述
			
 
				+罢了
			
 
				+者
			
 
				+而
			
 
				+而且
			
 
				+而况
			
 
				+而后
			
 
				+而外
			
 
				+而已
			
 
				+而是
			
 
				+而言
			
 
				+能
			
 
				+能否
			
 
				+腾
			
 
				+自
			
 
				+自个儿
			
 
				+自从
			
 
				+自各儿
			
 
				+自后
			
 
				+自家
			
 
				+自己
			
 
				+自打
			
 
				+自身
			
 
				+至
			
 
				+至于
			
 
				+至今
			
 
				+至若
			
 
				+致
			
 
				+般的
			
 
				+若
			
 
				+若夫
			
 
				+若是
			
 
				+若果 
			
 
				+若非
			
 
				+莫不然
			
 
				+莫如
			
 
				+莫若
			
 
				+虽
			
 
				+虽则
			
 
				+虽然
			
 
				+虽说
			
 
				+被
			
 
				+要
			
 
				+要不
			
 
				+要不是
			
 
				+要不然
			
 
				+要么
			
 
				+要是
			
 
				+譬喻
			
 
				+譬如
			
 
				+让
			
 
				+许多
			
 
				+论
			
 
				+设使
			
 
				+设或
			
 
				+设若
			
 
				+诚如
			
 
				+诚然
			
 
				+该
			
 
				+说来
			
 
				+诸
			
 
				+诸位
			
 
				+诸如
			
 
				+谁
			
 
				+谁人
			
 
				+谁料
			
 
				+谁知
			
 
				+贼死
			
 
				+赖以
			
 
				+赶
			
 
				+起
			
 
				+起见
			
 
				+趁
			
 
				+趁着
			
 
				+越是
			
 
				+距
			
 
				+跟
			
 
				+较
			
 
				+较之
			
 
				+边
			
 
				+过
			
 
				+还
			
 
				+还是
			
 
				+还有
			
 
				+还要
			
 
				+这
			
 
				+这一来
			
 
				+这个
			
 
				+这么
			
 
				+这么些
			
 
				+这么样
			
 
				+这么点儿
			
 
				+这些
			
 
				+这会儿
			
 
				+这儿
			
 
				+这就是说
			
 
				+这时
			
 
				+这样
			
 
				+这次
			
 
				+这般
			
 
				+这边
			
 
				+这里
			
 
				+进而
			
 
				+连
			
 
				+连同
			
 
				+逐步
			
 
				+通过
			
 
				+遵循
			
 
				+遵照
			
 
				+那
			
 
				+那个
			
 
				+那么
			
 
				+那么些
			
 
				+那么样
			
 
				+那些
			
 
				+那会儿
			
 
				+那儿
			
 
				+那时
			
 
				+那样
			
 
				+那般
			
 
				+那边
			
 
				+那里
			
 
				+都
			
 
				+鄙人
			
 
				+鉴于
			
 
				+针对
			
 
				+阿
			
 
				+除
			
 
				+除了
			
 
				+除外
			
 
				+除开
			
 
				+除此之外
			
 
				+除非
			
 
				+随
			
 
				+随后
			
 
				+随时
			
 
				+随着
			
 
				+难道说
			
 
				+非但
			
 
				+非徒
			
 
				+非特
			
 
				+非独
			
 
				+靠
			
 
				+顺
			
 
				+顺着
			
 
				+首先
			
 
				+！
			
 
				+，
			
 
				+：
			
 
				+；
			
 
				+？
			
--- a/data/stopwords/hit_stopwords.txt
+++ b/data/stopwords/hit_stopwords.txt
@@ -0,0 +1,767 @@
 
				+———
			
 
				+》），
			
 
				+）÷（１－
			
 
				+”，
			
 
				+）、
			
 
				+＝（
			
 
				+:
			
 
				+→
			
 
				+℃ 
			
 
				+&
			
 
				+*
			
 
				+一一
			
 
				+~~~~
			
 
				+’
			
 
				+. 
			
 
				+『
			
 
				+.一
			
 
				+./
			
 
				+-- 
			
 
				+』
			
 
				+＝″
			
 
				+【
			
 
				+［＊］
			
 
				+｝＞
			
 
				+［⑤］］
			
 
				+［①Ｄ］
			
 
				+ｃ］
			
 
				+ｎｇ昉
			
 
				+＊
			
 
				+//
			
 
				+［
			
 
				+］
			
 
				+［②ｅ］
			
 
				+［②ｇ］
			
 
				+＝｛
			
 
				+}
			
 
				+，也 
			
 
				+‘
			
 
				+Ａ
			
 
				+［①⑥］
			
 
				+［②Ｂ］ 
			
 
				+［①ａ］
			
 
				+［④ａ］
			
 
				+［①③］
			
 
				+［③ｈ］
			
 
				+③］
			
 
				+１． 
			
 
				+－－ 
			
 
				+［②ｂ］
			
 
				+’‘ 
			
 
				+××× 
			
 
				+［①⑧］
			
 
				+０：２ 
			
 
				+＝［
			
 
				+［⑤ｂ］
			
 
				+［②ｃ］ 
			
 
				+［④ｂ］
			
 
				+［②③］
			
 
				+［③ａ］
			
 
				+［④ｃ］
			
 
				+［①⑤］
			
 
				+［①⑦］
			
 
				+［①ｇ］
			
 
				+∈［ 
			
 
				+［①⑨］
			
 
				+［①④］
			
 
				+［①ｃ］
			
 
				+［②ｆ］
			
 
				+［②⑧］
			
 
				+［②①］
			
 
				+［①Ｃ］
			
 
				+［③ｃ］
			
 
				+［③ｇ］
			
 
				+［②⑤］
			
 
				+［②②］
			
 
				+一.
			
 
				+［①ｈ］
			
 
				+.数
			
 
				+［］
			
 
				+［①Ｂ］
			
 
				+数/
			
 
				+［①ｉ］
			
 
				+［③ｅ］
			
 
				+［①①］
			
 
				+［④ｄ］
			
 
				+［④ｅ］
			
 
				+［③ｂ］
			
 
				+［⑤ａ］
			
 
				+［①Ａ］
			
 
				+［②⑧］
			
 
				+［②⑦］
			
 
				+［①ｄ］
			
 
				+［②ｊ］
			
 
				+〕〔
			
 
				+］［
			
 
				+://
			
 
				+′∈
			
 
				+［②④
			
 
				+［⑤ｅ］
			
 
				+１２％
			
 
				+ｂ］
			
 
				+...
			
 
				+...................
			
 
				+…………………………………………………③
			
 
				+ＺＸＦＩＴＬ
			
 
				+［③Ｆ］
			
 
				+」
			
 
				+［①ｏ］
			
 
				+］∧′＝［ 
			
 
				+∪φ∈
			
 
				+′｜
			
 
				+｛－
			
 
				+②ｃ
			
 
				+｝
			
 
				+［③①］
			
 
				+Ｒ．Ｌ．
			
 
				+［①Ｅ］
			
 
				+Ψ
			
 
				+－［＊］－
			
 
				+↑
			
 
				+.日 
			
 
				+［②ｄ］
			
 
				+［②
			
 
				+［②⑦］
			
 
				+［②②］
			
 
				+［③ｅ］
			
 
				+［①ｉ］
			
 
				+［①Ｂ］
			
 
				+［①ｈ］
			
 
				+［①ｄ］
			
 
				+［①ｇ］
			
 
				+［①②］
			
 
				+［②ａ］
			
 
				+ｆ］
			
 
				+［⑩］
			
 
				+ａ］
			
 
				+［①ｅ］
			
 
				+［②ｈ］
			
 
				+［②⑥］
			
 
				+［③ｄ］
			
 
				+［②⑩］
			
 
				+ｅ］
			
 
				+〉
			
 
				+】
			
 
				+元／吨
			
 
				+［②⑩］
			
 
				+２．３％
			
 
				+５：０  
			
 
				+［①］
			
 
				+::
			
 
				+［②］
			
 
				+［③］
			
 
				+［④］
			
 
				+［⑤］
			
 
				+［⑥］
			
 
				+［⑦］
			
 
				+［⑧］
			
 
				+［⑨］ 
			
 
				+……
			
 
				+——
			
 
				+?
			
 
				+、
			
 
				+。
			
 
				+“
			
 
				+”
			
 
				+《
			
 
				+》
			
 
				+！
			
 
				+，
			
 
				+：
			
 
				+；
			
 
				+？
			
 
				+．
			
 
				+,
			
 
				+．
			
 
				+'
			
 
				+? 
			
 
				+·
			
 
				+———
			
 
				+──
			
 
				+? 
			
 
				+—
			
 
				+<
			
 
				+>
			
 
				+（
			
 
				+）
			
 
				+〔
			
 
				+〕
			
 
				+[
			
 
				+]
			
 
				+(
			
 
				+)
			
 
				+-
			
 
				++
			
 
				+～
			
 
				+×
			
 
				+／
			
 
				+/
			
 
				+①
			
 
				+②
			
 
				+③
			
 
				+④
			
 
				+⑤
			
 
				+⑥
			
 
				+⑦
			
 
				+⑧
			
 
				+⑨
			
 
				+⑩
			
 
				+Ⅲ
			
 
				+В
			
 
				+"
			
 
				+;
			
 
				+#
			
 
				+@
			
 
				+γ
			
 
				+μ
			
 
				+φ
			
 
				+φ．
			
 
				+× 
			
 
				+Δ
			
 
				+■
			
 
				+▲
			
 
				+sub
			
 
				+exp 
			
 
				+sup
			
 
				+sub
			
 
				+Lex 
			
 
				+＃
			
 
				+％
			
 
				+＆
			
 
				+＇
			
 
				+＋
			
 
				+＋ξ
			
 
				+＋＋
			
 
				+－
			
 
				+－β
			
 
				+＜
			
 
				+＜±
			
 
				+＜Δ
			
 
				+＜λ
			
 
				+＜φ
			
 
				+＜＜
			
 
				+=
			
 
				+＝
			
 
				+＝☆
			
 
				+＝－
			
 
				+＞
			
 
				+＞λ
			
 
				+＿
			
 
				+～±
			
 
				+～＋
			
 
				+［⑤ｆ］
			
 
				+［⑤ｄ］
			
 
				+［②ｉ］
			
 
				+≈ 
			
 
				+［②Ｇ］
			
 
				+［①ｆ］
			
 
				+ＬＩ
			
 
				+㈧ 
			
 
				+［－
			
 
				+......
			
 
				+〉
			
 
				+［③⑩］
			
 
				+第二
			
 
				+一番
			
 
				+一直
			
 
				+一个
			
 
				+一些
			
 
				+许多
			
 
				+种
			
 
				+有的是
			
 
				+也就是说
			
 
				+末##末
			
 
				+啊
			
 
				+阿
			
 
				+哎
			
 
				+哎呀
			
 
				+哎哟
			
 
				+唉
			
 
				+俺
			
 
				+俺们
			
 
				+按
			
 
				+按照
			
 
				+吧
			
 
				+吧哒
			
 
				+把
			
 
				+罢了
			
 
				+被
			
 
				+本
			
 
				+本着
			
 
				+比
			
 
				+比方
			
 
				+比如
			
 
				+鄙人
			
 
				+彼
			
 
				+彼此
			
 
				+边
			
 
				+别
			
 
				+别的
			
 
				+别说
			
 
				+并
			
 
				+并且
			
 
				+不比
			
 
				+不成
			
 
				+不单
			
 
				+不但
			
 
				+不独
			
 
				+不管
			
 
				+不光
			
 
				+不过
			
 
				+不仅
			
 
				+不拘
			
 
				+不论
			
 
				+不怕
			
 
				+不然
			
 
				+不如
			
 
				+不特
			
 
				+不惟
			
 
				+不问
			
 
				+不只
			
 
				+朝
			
 
				+朝着
			
 
				+趁
			
 
				+趁着
			
 
				+乘
			
 
				+冲
			
 
				+除
			
 
				+除此之外
			
 
				+除非
			
 
				+除了
			
 
				+此
			
 
				+此间
			
 
				+此外
			
 
				+从
			
 
				+从而
			
 
				+打
			
 
				+待
			
 
				+但
			
 
				+但是
			
 
				+当
			
 
				+当着
			
 
				+到
			
 
				+得
			
 
				+的
			
 
				+的话
			
 
				+等
			
 
				+等等
			
 
				+地
			
 
				+第
			
 
				+叮咚
			
 
				+对
			
 
				+对于
			
 
				+多
			
 
				+多少
			
 
				+而
			
 
				+而况
			
 
				+而且
			
 
				+而是
			
 
				+而外
			
 
				+而言
			
 
				+而已
			
 
				+尔后
			
 
				+反过来
			
 
				+反过来说
			
 
				+反之
			
 
				+非但
			
 
				+非徒
			
 
				+否则
			
 
				+嘎
			
 
				+嘎登
			
 
				+该
			
 
				+赶
			
 
				+个
			
 
				+各
			
 
				+各个
			
 
				+各位
			
 
				+各种
			
 
				+各自
			
 
				+给
			
 
				+根据
			
 
				+跟
			
 
				+故
			
 
				+故此
			
 
				+固然
			
 
				+关于
			
 
				+管
			
 
				+归
			
 
				+果然
			
 
				+果真
			
 
				+过
			
 
				+哈
			
 
				+哈哈
			
 
				+呵
			
 
				+和
			
 
				+何
			
 
				+何处
			
 
				+何况
			
 
				+何时
			
 
				+嘿
			
 
				+哼
			
 
				+哼唷
			
 
				+呼哧
			
 
				+乎
			
 
				+哗
			
 
				+还是
			
 
				+还有
			
 
				+换句话说
			
 
				+换言之
			
 
				+或
			
 
				+或是
			
 
				+或者
			
 
				+极了
			
 
				+及
			
 
				+及其
			
 
				+及至
			
 
				+即
			
 
				+即便
			
 
				+即或
			
 
				+即令
			
 
				+即若
			
 
				+即使
			
 
				+几
			
 
				+几时
			
 
				+己
			
 
				+既
			
 
				+既然
			
 
				+既是
			
 
				+继而
			
 
				+加之
			
 
				+假如
			
 
				+假若
			
 
				+假使
			
 
				+鉴于
			
 
				+将
			
 
				+较
			
 
				+较之
			
 
				+叫
			
 
				+接着
			
 
				+结果
			
 
				+借
			
 
				+紧接着
			
 
				+进而
			
 
				+尽
			
 
				+尽管
			
 
				+经
			
 
				+经过
			
 
				+就
			
 
				+就是
			
 
				+就是说
			
 
				+据
			
 
				+具体地说
			
 
				+具体说来
			
 
				+开始
			
 
				+开外
			
 
				+靠
			
 
				+咳
			
 
				+可
			
 
				+可见
			
 
				+可是
			
 
				+可以
			
 
				+况且
			
 
				+啦
			
 
				+来
			
 
				+来着
			
 
				+离
			
 
				+例如
			
 
				+哩
			
 
				+连
			
 
				+连同
			
 
				+两者
			
 
				+了
			
 
				+临
			
 
				+另
			
 
				+另外
			
 
				+另一方面
			
 
				+论
			
 
				+嘛
			
 
				+吗
			
 
				+慢说
			
 
				+漫说
			
 
				+冒
			
 
				+么
			
 
				+每
			
 
				+每当
			
 
				+们
			
 
				+莫若
			
 
				+某
			
 
				+某个
			
 
				+某些
			
 
				+拿
			
 
				+哪
			
 
				+哪边
			
 
				+哪儿
			
 
				+哪个
			
 
				+哪里
			
 
				+哪年
			
 
				+哪怕
			
 
				+哪天
			
 
				+哪些
			
 
				+哪样
			
 
				+那
			
 
				+那边
			
 
				+那儿
			
 
				+那个
			
 
				+那会儿
			
 
				+那里
			
 
				+那么
			
 
				+那么些
			
 
				+那么样
			
 
				+那时
			
 
				+那些
			
 
				+那样
			
 
				+乃
			
 
				+乃至
			
 
				+呢
			
 
				+能
			
 
				+你
			
 
				+你们
			
 
				+您
			
 
				+宁
			
 
				+宁可
			
 
				+宁肯
			
 
				+宁愿
			
 
				+哦
			
 
				+呕
			
 
				+啪达
			
 
				+旁人
			
 
				+呸
			
 
				+凭
			
 
				+凭借
			
 
				+其
			
 
				+其次
			
 
				+其二
			
 
				+其他
			
 
				+其它
			
 
				+其一
			
 
				+其余
			
 
				+其中
			
 
				+起
			
 
				+起见
			
 
				+起见
			
 
				+岂但
			
 
				+恰恰相反
			
 
				+前后
			
 
				+前者
			
 
				+且
			
 
				+然而
			
 
				+然后
			
 
				+然则
			
 
				+让
			
 
				+人家
			
 
				+任
			
 
				+任何
			
 
				+任凭
			
 
				+如
			
 
				+如此
			
 
				+如果
			
 
				+如何
			
 
				+如其
			
 
				+如若
			
 
				+如上所述
			
 
				+若
			
 
				+若非
			
 
				+若是
			
 
				+啥
			
 
				+上下
			
 
				+尚且
			
 
				+设若
			
 
				+设使
			
 
				+甚而
			
 
				+甚么
			
 
				+甚至
			
 
				+省得
			
 
				+时候
			
 
				+什么
			
 
				+什么样
			
 
				+使得
			
 
				+是
			
 
				+是的
			
 
				+首先
			
 
				+谁
			
 
				+谁知
			
 
				+顺
			
 
				+顺着
			
 
				+似的
			
 
				+虽
			
 
				+虽然
			
 
				+虽说
			
 
				+虽则
			
 
				+随
			
 
				+随着
			
 
				+所
			
 
				+所以
			
 
				+他
			
 
				+他们
			
 
				+他人
			
 
				+它
			
 
				+它们
			
 
				+她
			
 
				+她们
			
 
				+倘
			
 
				+倘或
			
 
				+倘然
			
 
				+倘若
			
 
				+倘使
			
 
				+腾
			
 
				+替
			
 
				+通过
			
 
				+同
			
 
				+同时
			
 
				+哇
			
 
				+万一
			
 
				+往
			
 
				+望
			
 
				+为
			
 
				+为何
			
 
				+为了
			
 
				+为什么
			
 
				+为着
			
 
				+喂
			
 
				+嗡嗡
			
 
				+我
			
 
				+我们
			
 
				+呜
			
 
				+呜呼
			
 
				+乌乎
			
 
				+无论
			
 
				+无宁
			
 
				+毋宁
			
 
				+嘻
			
 
				+吓
			
 
				+相对而言
			
 
				+像
			
 
				+向
			
 
				+向着
			
 
				+嘘
			
 
				+呀
			
 
				+焉
			
 
				+沿
			
 
				+沿着
			
 
				+要
			
 
				+要不
			
 
				+要不然
			
 
				+要不是
			
 
				+要么
			
 
				+要是
			
 
				+也
			
 
				+也罢
			
 
				+也好
			
 
				+一
			
 
				+一般
			
 
				+一旦
			
 
				+一方面
			
 
				+一来
			
 
				+一切
			
 
				+一样
			
 
				+一则
			
 
				+依
			
 
				+依照
			
 
				+矣
			
 
				+以
			
 
				+以便
			
 
				+以及
			
 
				+以免
			
 
				+以至
			
 
				+以至于
			
 
				+以致
			
 
				+抑或
			
 
				+因
			
 
				+因此
			
 
				+因而
			
 
				+因为
			
 
				+哟
			
 
				+用
			
 
				+由
			
 
				+由此可见
			
 
				+由于
			
 
				+有
			
 
				+有的
			
 
				+有关
			
 
				+有些
			
 
				+又
			
 
				+于
			
 
				+于是
			
 
				+于是乎
			
 
				+与
			
 
				+与此同时
			
 
				+与否
			
 
				+与其
			
 
				+越是
			
 
				+云云
			
 
				+哉
			
 
				+再说
			
 
				+再者
			
 
				+在
			
 
				+在下
			
 
				+咱
			
 
				+咱们
			
 
				+则
			
 
				+怎
			
 
				+怎么
			
 
				+怎么办
			
 
				+怎么样
			
 
				+怎样
			
 
				+咋
			
 
				+照
			
 
				+照着
			
 
				+者
			
 
				+这
			
 
				+这边
			
 
				+这儿
			
 
				+这个
			
 
				+这会儿
			
 
				+这就是说
			
 
				+这里
			
 
				+这么
			
 
				+这么点儿
			
 
				+这么些
			
 
				+这么样
			
 
				+这时
			
 
				+这些
			
 
				+这样
			
 
				+正如
			
 
				+吱
			
 
				+之
			
 
				+之类
			
 
				+之所以
			
 
				+之一
			
 
				+只是
			
 
				+只限
			
 
				+只要
			
 
				+只有
			
 
				+至
			
 
				+至于
			
 
				+诸位
			
 
				+着
			
 
				+着呢
			
 
				+自
			
 
				+自从
			
 
				+自个儿
			
 
				+自各儿
			
 
				+自己
			
 
				+自家
			
 
				+自身
			
 
				+综上所述
			
 
				+总的来看
			
 
				+总的来说
			
 
				+总的说来
			
 
				+总而言之
			
 
				+总之
			
 
				+纵
			
 
				+纵令
			
 
				+纵然
			
 
				+纵使
			
 
				+遵照
			
 
				+作为
			
 
				+兮
			
 
				+呃
			
 
				+呗
			
 
				+咚
			
 
				+咦
			
 
				+喏
			
 
				+啐
			
 
				+喔唷
			
 
				+嗬
			
 
				+嗯
			
 
				+嗳
			
--- a/data/stopwords/scu_stopwords.txt
+++ b/data/stopwords/scu_stopwords.txt
@@ -0,0 +1,976 @@
 
				+打开天窗说亮话
			
 
				+到目前为止
			
 
				+赶早不赶晚
			
 
				+常言说得好
			
 
				+何乐而不为
			
 
				+毫无保留地
			
 
				+由此可见
			
 
				+这就是说
			
 
				+这么点儿
			
 
				+综上所述
			
 
				+总的来看
			
 
				+总的来说
			
 
				+总的说来
			
 
				+总而言之
			
 
				+相对而言
			
 
				+除此之外
			
 
				+反过来说
			
 
				+恰恰相反
			
 
				+如上所述
			
 
				+换句话说
			
 
				+具体地说
			
 
				+具体说来
			
 
				+另一方面
			
 
				+与此同时
			
 
				+一则通过
			
 
				+毫无例外
			
 
				+不然的话
			
 
				+从此以后
			
 
				+从古到今
			
 
				+从古至今
			
 
				+从今以后
			
 
				+大张旗鼓
			
 
				+从无到有
			
 
				+从早到晚
			
 
				+弹指之间
			
 
				+不亦乐乎
			
 
				+不知不觉
			
 
				+不止一次
			
 
				+不择手段
			
 
				+不可开交
			
 
				+不可抗拒
			
 
				+不仅仅是
			
 
				+不管怎样
			
 
				+挨家挨户
			
 
				+长此下去
			
 
				+长话短说
			
 
				+除此而外
			
 
				+除此以外
			
 
				+除此之外
			
 
				+得天独厚
			
 
				+川流不息
			
 
				+长期以来
			
 
				+挨门挨户
			
 
				+挨门逐户
			
 
				+多多少少
			
 
				+多多益善
			
 
				+二话不说
			
 
				+更进一步
			
 
				+二话没说
			
 
				+分期分批
			
 
				+风雨无阻
			
 
				+归根到底
			
 
				+归根结底
			
 
				+反之亦然
			
 
				+大面儿上
			
 
				+倒不如说
			
 
				+成年累月
			
 
				+换句话说
			
 
				+或多或少
			
 
				+简而言之
			
 
				+接连不断
			
 
				+尽如人意
			
 
				+尽心竭力
			
 
				+尽心尽力
			
 
				+尽管如此
			
 
				+据我所知
			
 
				+具体地说
			
 
				+具体来说
			
 
				+具体说来
			
 
				+近几年来
			
 
				+每时每刻
			
 
				+屡次三番
			
 
				+三番两次
			
 
				+三番五次
			
 
				+三天两头
			
 
				+另一方面
			
 
				+老老实实
			
 
				+年复一年
			
 
				+恰恰相反
			
 
				+顷刻之间
			
 
				+穷年累月
			
 
				+千万千万
			
 
				+日复一日
			
 
				+如此等等
			
 
				+如前所述
			
 
				+如上所述
			
 
				+一方面
			
 
				+切不可
			
 
				+顷刻间
			
 
				+全身心
			
 
				+另方面
			
 
				+另一个
			
 
				+猛然间
			
 
				+默默地
			
 
				+就是说
			
 
				+近年来
			
 
				+尽可能
			
 
				+接下来
			
 
				+简言之
			
 
				+急匆匆
			
 
				+即是说
			
 
				+基本上
			
 
				+换言之
			
 
				+充其极
			
 
				+充其量
			
 
				+暗地里
			
 
				+反之则
			
 
				+比如说
			
 
				+背地里
			
 
				+背靠背
			
 
				+并没有
			
 
				+不得不
			
 
				+不得了
			
 
				+不得已
			
 
				+不仅仅
			
 
				+不经意
			
 
				+不能不
			
 
				+不外乎
			
 
				+不由得
			
 
				+不怎么
			
 
				+不至于
			
 
				+策略地
			
 
				+差不多
			
 
				+常言道
			
 
				+常言说
			
 
				+多年来
			
 
				+多年前
			
 
				+差一点
			
 
				+敞开儿
			
 
				+抽冷子
			
 
				+大不了
			
 
				+反倒是
			
 
				+反过来
			
 
				+大体上
			
 
				+当口儿
			
 
				+倒不如
			
 
				+怪不得
			
 
				+动不动
			
 
				+看起来
			
 
				+看上去
			
 
				+看样子
			
 
				+够瞧的
			
 
				+到了儿
			
 
				+呆呆地
			
 
				+来不及
			
 
				+来得及
			
 
				+到头来
			
 
				+连日来
			
 
				+于是乎
			
 
				+为什么
			
 
				+这会儿
			
 
				+换言之
			
 
				+那会儿
			
 
				+那么些
			
 
				+那么样
			
 
				+什么样
			
 
				+反过来
			
 
				+紧接着
			
 
				+就是说
			
 
				+要不然
			
 
				+要不是
			
 
				+一方面
			
 
				+以至于
			
 
				+自个儿
			
 
				+自各儿
			
 
				+之所以
			
 
				+这么些
			
 
				+这么样
			
 
				+怎么办
			
 
				+怎么样
			
 
				+谁知
			
 
				+顺着
			
 
				+似的
			
 
				+虽然
			
 
				+虽说
			
 
				+虽则
			
 
				+随着
			
 
				+所以
			
 
				+他们
			
 
				+他人
			
 
				+它们
			
 
				+她们
			
 
				+倘或
			
 
				+倘然
			
 
				+倘若
			
 
				+倘使
			
 
				+要么
			
 
				+要是
			
 
				+也罢
			
 
				+也好
			
 
				+以便
			
 
				+依照
			
 
				+以及
			
 
				+以免
			
 
				+以至
			
 
				+以致
			
 
				+抑或
			
 
				+因此
			
 
				+因而
			
 
				+因为
			
 
				+由于
			
 
				+有的
			
 
				+有关
			
 
				+有些
			
 
				+于是
			
 
				+与否
			
 
				+与其
			
 
				+越是
			
 
				+云云
			
 
				+一般
			
 
				+一旦
			
 
				+一来
			
 
				+一切
			
 
				+一样
			
 
				+同时
			
 
				+万一
			
 
				+为何
			
 
				+为了
			
 
				+为着
			
 
				+嗡嗡
			
 
				+我们
			
 
				+呜呼
			
 
				+乌乎
			
 
				+无论
			
 
				+无宁
			
 
				+沿着
			
 
				+毋宁
			
 
				+向着
			
 
				+照着
			
 
				+怎么
			
 
				+咱们
			
 
				+在下
			
 
				+再说
			
 
				+再者
			
 
				+怎样
			
 
				+这边
			
 
				+这儿
			
 
				+这个
			
 
				+这里
			
 
				+这么
			
 
				+这时
			
 
				+这些
			
 
				+这样
			
 
				+正如
			
 
				+之类
			
 
				+之一
			
 
				+只是
			
 
				+只限
			
 
				+只要
			
 
				+只有
			
 
				+至于
			
 
				+诸位
			
 
				+着呢
			
 
				+纵令
			
 
				+纵然
			
 
				+纵使
			
 
				+遵照
			
 
				+作为
			
 
				+喔唷
			
 
				+自从
			
 
				+自己
			
 
				+自家
			
 
				+自身
			
 
				+总之
			
 
				+要不
			
 
				+哎呀
			
 
				+哎哟
			
 
				+俺们
			
 
				+按照
			
 
				+吧哒
			
 
				+罢了
			
 
				+本着
			
 
				+比方
			
 
				+比如
			
 
				+鄙人
			
 
				+彼此
			
 
				+别的
			
 
				+别说
			
 
				+并且
			
 
				+不比
			
 
				+不成
			
 
				+不单
			
 
				+不但
			
 
				+不独
			
 
				+不管
			
 
				+不光
			
 
				+不过
			
 
				+不仅
			
 
				+不拘
			
 
				+不论
			
 
				+不怕
			
 
				+不然
			
 
				+不如
			
 
				+不特
			
 
				+不惟
			
 
				+不问
			
 
				+不只
			
 
				+朝着
			
 
				+趁着
			
 
				+除非
			
 
				+除了
			
 
				+此间
			
 
				+此外
			
 
				+从而
			
 
				+但是
			
 
				+当着
			
 
				+的话
			
 
				+等等
			
 
				+叮咚
			
 
				+对于
			
 
				+多少
			
 
				+而况
			
 
				+而且
			
 
				+而是
			
 
				+而外
			
 
				+而言
			
 
				+而已
			
 
				+尔后
			
 
				+反之
			
 
				+非但
			
 
				+非徒
			
 
				+否则
			
 
				+嘎登
			
 
				+各个
			
 
				+各位
			
 
				+各种
			
 
				+各自
			
 
				+根据
			
 
				+故此
			
 
				+固然
			
 
				+关于
			
 
				+果然
			
 
				+果真
			
 
				+哈哈
			
 
				+何处
			
 
				+何况
			
 
				+何时
			
 
				+哼唷
			
 
				+呼哧
			
 
				+还是
			
 
				+还有
			
 
				+或是
			
 
				+或者
			
 
				+极了
			
 
				+及其
			
 
				+及至
			
 
				+即便
			
 
				+即或
			
 
				+即令
			
 
				+即若
			
 
				+即使
			
 
				+既然
			
 
				+既是
			
 
				+继而
			
 
				+加之
			
 
				+假如
			
 
				+假若
			
 
				+假使
			
 
				+鉴于
			
 
				+几时
			
 
				+较之
			
 
				+接着
			
 
				+结果
			
 
				+进而
			
 
				+尽管
			
 
				+经过
			
 
				+就是
			
 
				+可见
			
 
				+可是
			
 
				+可以
			
 
				+况且
			
 
				+开始
			
 
				+开外
			
 
				+来着
			
 
				+例如
			
 
				+连同
			
 
				+两者
			
 
				+另外
			
 
				+慢说
			
 
				+漫说
			
 
				+每当
			
 
				+莫若
			
 
				+某个
			
 
				+某些
			
 
				+哪边
			
 
				+哪儿
			
 
				+哪个
			
 
				+哪里
			
 
				+哪年
			
 
				+哪怕
			
 
				+哪天
			
 
				+哪些
			
 
				+哪样
			
 
				+那边
			
 
				+那儿
			
 
				+那个
			
 
				+那里
			
 
				+那么
			
 
				+那时
			
 
				+那些
			
 
				+那样
			
 
				+乃至
			
 
				+宁可
			
 
				+宁肯
			
 
				+宁愿
			
 
				+你们
			
 
				+啪达
			
 
				+旁人
			
 
				+凭借
			
 
				+其次
			
 
				+其二
			
 
				+其他
			
 
				+其它
			
 
				+其一
			
 
				+其余
			
 
				+其中
			
 
				+起见
			
 
				+起见
			
 
				+岂但
			
 
				+前后
			
 
				+前者
			
 
				+然而
			
 
				+然后
			
 
				+然则
			
 
				+人家
			
 
				+任何
			
 
				+任凭
			
 
				+如此
			
 
				+如果
			
 
				+如何
			
 
				+如其
			
 
				+如若
			
 
				+若非
			
 
				+若是
			
 
				+上下
			
 
				+尚且
			
 
				+设若
			
 
				+设使
			
 
				+甚而
			
 
				+甚么
			
 
				+甚至
			
 
				+省得
			
 
				+时候
			
 
				+什么
			
 
				+使得
			
 
				+是的
			
 
				+首先
			
 
				+首先
			
 
				+其次
			
 
				+再次
			
 
				+最后
			
 
				+您们
			
 
				+它们
			
 
				+她们
			
 
				+他们
			
 
				+我们
			
 
				+你是
			
 
				+您是
			
 
				+我是
			
 
				+他是
			
 
				+她是
			
 
				+它是
			
 
				+不是
			
 
				+你们
			
 
				+啊哈
			
 
				+啊呀
			
 
				+啊哟
			
 
				+挨次
			
 
				+挨个
			
 
				+挨着
			
 
				+哎呀
			
 
				+哎哟
			
 
				+俺们
			
 
				+按理
			
 
				+按期
			
 
				+默然
			
 
				+按时
			
 
				+按说
			
 
				+按照
			
 
				+暗中
			
 
				+暗自
			
 
				+昂然
			
 
				+八成
			
 
				+倍感
			
 
				+倍加
			
 
				+本人
			
 
				+本身
			
 
				+本着
			
 
				+并非
			
 
				+别人
			
 
				+必定
			
 
				+比起
			
 
				+比如
			
 
				+比照
			
 
				+鄙人
			
 
				+毕竟
			
 
				+必将
			
 
				+必须
			
 
				+并肩
			
 
				+并没
			
 
				+并排
			
 
				+并且
			
 
				+并无
			
 
				+勃然
			
 
				+不必
			
 
				+不常
			
 
				+不大
			
 
				+不单
			
 
				+不但
			
 
				+而且
			
 
				+不得
			
 
				+不迭
			
 
				+不定
			
 
				+不独
			
 
				+不对
			
 
				+不妨
			
 
				+不管
			
 
				+不光
			
 
				+不过
			
 
				+不会
			
 
				+不仅
			
 
				+不拘
			
 
				+不力
			
 
				+不了
			
 
				+不料
			
 
				+不论
			
 
				+不满
			
 
				+不免
			
 
				+不起
			
 
				+不巧
			
 
				+不然
			
 
				+不日
			
 
				+不少
			
 
				+不胜
			
 
				+不时
			
 
				+不是
			
 
				+不同
			
 
				+不能
			
 
				+不要
			
 
				+不外
			
 
				+不下
			
 
				+不限
			
 
				+不消
			
 
				+不已
			
 
				+不再
			
 
				+不曾
			
 
				+不止
			
 
				+不只
			
 
				+才能
			
 
				+彻夜
			
 
				+趁便
			
 
				+趁机
			
 
				+趁热
			
 
				+趁势
			
 
				+趁早
			
 
				+趁着
			
 
				+成心
			
 
				+乘机
			
 
				+乘势
			
 
				+乘隙
			
 
				+乘虚
			
 
				+诚然
			
 
				+迟早
			
 
				+充分
			
 
				+出来
			
 
				+出去
			
 
				+除此
			
 
				+除非
			
 
				+除开
			
 
				+除了
			
 
				+除去
			
 
				+除却
			
 
				+除外
			
 
				+处处
			
 
				+传说
			
 
				+传闻
			
 
				+纯粹
			
 
				+此后
			
 
				+此间
			
 
				+此外
			
 
				+此中
			
 
				+次第
			
 
				+匆匆
			
 
				+从不
			
 
				+从此
			
 
				+从而
			
 
				+从宽
			
 
				+从来
			
 
				+从轻
			
 
				+从速
			
 
				+从头
			
 
				+从未
			
 
				+从小
			
 
				+从新
			
 
				+从严
			
 
				+从优
			
 
				+从中
			
 
				+从重
			
 
				+凑巧
			
 
				+存心
			
 
				+达旦
			
 
				+打从
			
 
				+大大
			
 
				+大抵
			
 
				+大都
			
 
				+大多
			
 
				+大凡
			
 
				+大概
			
 
				+大家
			
 
				+大举
			
 
				+大略
			
 
				+大约
			
 
				+大致
			
 
				+待到
			
 
				+单纯
			
 
				+单单
			
 
				+但是
			
 
				+但愿
			
 
				+当场
			
 
				+当儿
			
 
				+当即
			
 
				+当然
			
 
				+当庭
			
 
				+当头
			
 
				+当下
			
 
				+当真
			
 
				+当中
			
 
				+当着
			
 
				+倒是
			
 
				+到处
			
 
				+到底
			
 
				+到头
			
 
				+得起
			
 
				+的话
			
 
				+的确
			
 
				+等到
			
 
				+等等
			
 
				+顶多
			
 
				+动辄
			
 
				+陡然
			
 
				+独自
			
 
				+断然
			
 
				+对于
			
 
				+顿时
			
 
				+多次
			
 
				+多多
			
 
				+多亏
			
 
				+而后
			
 
				+而论
			
 
				+而且
			
 
				+而是
			
 
				+而外
			
 
				+而言
			
 
				+而已
			
 
				+而又
			
 
				+尔等
			
 
				+反倒
			
 
				+反而
			
 
				+反手
			
 
				+反之
			
 
				+方才
			
 
				+方能
			
 
				+非常
			
 
				+非但
			
 
				+非得
			
 
				+分头
			
 
				+奋勇
			
 
				+愤然
			
 
				+更为
			
 
				+更加
			
 
				+根据
			
 
				+个人
			
 
				+各式
			
 
				+刚才
			
 
				+敢情
			
 
				+该当
			
 
				+嘎嘎
			
 
				+否则
			
 
				+赶快
			
 
				+敢于
			
 
				+刚好
			
 
				+刚巧
			
 
				+高低
			
 
				+格外
			
 
				+隔日
			
 
				+隔夜
			
 
				+公然
			
 
				+过于
			
 
				+果然
			
 
				+果真
			
 
				+光是
			
 
				+关于
			
 
				+共总
			
 
				+姑且
			
 
				+故此
			
 
				+故而
			
 
				+故意
			
 
				+固然
			
 
				+惯常
			
 
				+毫不
			
 
				+毫无
			
 
				+很多
			
 
				+何须
			
 
				+好在
			
 
				+何必
			
 
				+何尝
			
 
				+何妨
			
 
				+何苦
			
 
				+何况
			
 
				+何止
			
 
				+很少
			
 
				+轰然
			
 
				+后来
			
 
				+呼啦
			
 
				+哗啦
			
 
				+互相
			
 
				+忽地
			
 
				+忽然
			
 
				+话说
			
 
				+或是
			
 
				+伙同
			
 
				+豁然
			
 
				+恍然
			
 
				+还是
			
 
				+或许
			
 
				+或者
			
 
				+基本
			
 
				+基于
			
 
				+极大
			
 
				+极度
			
 
				+极端
			
 
				+极力
			
 
				+极其
			
 
				+极为
			
 
				+即便
			
 
				+即将
			
 
				+及其
			
 
				+及至
			
 
				+即刻
			
 
				+即令
			
 
				+即使
			
 
				+几度
			
 
				+几番
			
 
				+几乎
			
 
				+几经
			
 
				+既然
			
 
				+继而
			
 
				+继之
			
 
				+加上
			
 
				+加以
			
 
				+加之
			
 
				+假如
			
 
				+假若
			
 
				+假使
			
 
				+间或
			
 
				+将才
			
 
				+简直
			
 
				+鉴于
			
 
				+将近
			
 
				+将要
			
 
				+交口
			
 
				+较比
			
 
				+较为
			
 
				+较之
			
 
				+皆可
			
 
				+截然
			
 
				+截至
			
 
				+藉以
			
 
				+借此
			
 
				+借以
			
 
				+届时
			
 
				+尽快
			
 
				+近来
			
 
				+进而
			
 
				+进来
			
 
				+进去
			
 
				+尽管
			
 
				+尽量
			
 
				+尽然
			
 
				+就算
			
 
				+居然
			
 
				+就此
			
 
				+就地
			
 
				+竟然
			
 
				+究竟
			
 
				+经常
			
 
				+尽早
			
 
				+精光
			
 
				+经过
			
 
				+就是
			
 
				+局外
			
 
				+举凡
			
 
				+据称
			
 
				+据此
			
 
				+据实
			
 
				+据说
			
 
				+可好
			
 
				+看来
			
 
				+开外
			
 
				+绝不
			
 
				+决不
			
 
				+据悉
			
 
				+决非
			
 
				+绝顶
			
 
				+绝对
			
 
				+绝非
			
 
				+可见
			
 
				+可能
			
 
				+可是
			
 
				+可以
			
 
				+恐怕
			
 
				+来讲
			
 
				+来看
			
 
				+快要
			
 
				+况且
			
 
				+拦腰
			
 
				+牢牢
			
 
				+老是
			
 
				+累次
			
 
				+累年
			
 
				+理当
			
 
				+理该
			
 
				+理应
			
 
				+例如
			
 
				+立地
			
 
				+立刻
			
 
				+立马
			
 
				+立时
			
 
				+联袂
			
 
				+连连
			
 
				+连日
			
 
				+路经
			
 
				+临到
			
 
				+连声
			
 
				+连同
			
 
				+连袂
			
 
				+另外
			
 
				+另行
			
 
				+屡次
			
 
				+屡屡
			
 
				+缕缕
			
 
				+率尔
			
 
				+率然
			
 
				+略加
			
 
				+略微
			
 
				+略为
			
 
				+论说
			
 
				+马上
			
 
				+猛然
			
 
				+没有
			
 
				+每当
			
 
				+每逢
			
 
				+每每
			
 
				+莫不
			
 
				+莫非
			
 
				+莫如
			
 
				+莫若
			
 
				+哪怕
			
 
				+那么
			
 
				+那末
			
 
				+那些
			
 
				+乃至
			
 
				+难道
			
 
				+难得
			
 
				+难怪
			
 
				+难说
			
 
				+你们
			
 
				+凝神
			
 
				+宁可
			
 
				+宁肯
			
 
				+宁愿
			
 
				+偶而
			
 
				+偶尔
			
 
				+碰巧
			
 
				+譬如
			
 
				+偏偏
			
 
				+平素
			
 
				+迫于
			
 
				+扑通
			
 
				+其次
			
 
				+其后
			
 
				+其实
			
 
				+其它
			
 
				+起初
			
 
				+起来
			
 
				+起首
			
 
				+起头
			
 
				+起先
			
 
				+岂但
			
 
				+岂非
			
 
				+岂止
			
 
				+恰逢
			
 
				+恰好
			
 
				+恰恰
			
 
				+恰巧
			
 
				+恰如
			
 
				+恰似
			
 
				+前后
			
 
				+前者
			
 
				+切莫
			
 
				+切切
			
 
				+切勿
			
 
				+亲口
			
 
				+亲身
			
 
				+亲手
			
 
				+亲眼
			
 
				+亲自
			
 
				+顷刻
			
 
				+请勿
			
 
				+取道
			
 
				+权时
			
 
				+全都
			
 
				+全力
			
 
				+全年
			
 
				+全然
			
 
				+然而
			
 
				+然后
			
 
				+人家
			
 
				+人人
			
 
				+仍旧
			
 
				+仍然
			
 
				+日见
			
 
				+日渐
			
 
				+日益
			
 
				+日臻
			
 
				+如常
			
 
				+如次
			
 
				+如果
			
 
				+如今
			
 
				+如期
			
 
				+如若
			
 
				+如上
			
 
				+如下
			
 
				+上来
			
 
				+上去
			
 
				+瑟瑟
			
 
				+沙沙
			
 
				+啊
			
 
				+哎
			
 
				+唉
			
 
				+俺
			
 
				+按
			
 
				+吧
			
 
				+把
			
 
				+甭
			
 
				+别
			
 
				+嘿
			
 
				+很
			
 
				+乎
			
 
				+会
			
 
				+或
			
 
				+既
			
 
				+及
			
 
				+啦
			
 
				+了
			
 
				+们
			
 
				+你
			
 
				+您
			
 
				+哦
			
 
				+砰
			
 
				+啊
			
 
				+你
			
 
				+我
			
 
				+他
			
 
				+她
			
 
				+它
			
--- a/data/stopwords/停用词.txt
+++ b/data/stopwords/停用词.txt
@@ -0,0 +1,1893 @@
 
				+!
			
 
				+"
			
 
				+#
			
 
				+$
			
 
				+%
			
 
				+&
			
 
				+'
			
 
				+(
			
 
				+)
			
 
				+*
			
 
				++
			
 
				+,
			
 
				+-
			
 
				+--
			
 
				+.
			
 
				+..
			
 
				+...
			
 
				+......
			
 
				+...................
			
 
				+./
			
 
				+.一
			
 
				+.数
			
 
				+.日
			
 
				+/
			
 
				+//
			
 
				+0
			
 
				+1
			
 
				+2
			
 
				+3
			
 
				+4
			
 
				+5
			
 
				+6
			
 
				+7
			
 
				+8
			
 
				+9
			
 
				+:
			
 
				+://
			
 
				+::
			
 
				+;
			
 
				+<
			
 
				+=
			
 
				+>
			
 
				+>>
			
 
				+?
			
 
				+@
			
 
				+A
			
 
				+Lex
			
 
				+[
			
 
				+\
			
 
				+]
			
 
				+^
			
 
				+_
			
 
				+`
			
 
				+exp
			
 
				+sub
			
 
				+sup
			
 
				+|
			
 
				+}
			
 
				+~
			
 
				+~~~~
			
 
				+·
			
 
				+×
			
 
				+×××
			
 
				+Δ
			
 
				+Ψ
			
 
				+γ
			
 
				+μ
			
 
				+φ
			
 
				+φ．
			
 
				+В
			
 
				+—
			
 
				+——
			
 
				+———
			
 
				+‘
			
 
				+’
			
 
				+’‘
			
 
				+“
			
 
				+”
			
 
				+”，
			
 
				+…
			
 
				+……
			
 
				+…………………………………………………③
			
 
				+′∈
			
 
				+′｜
			
 
				+℃
			
 
				+Ⅲ
			
 
				+↑
			
 
				+→
			
 
				+∈［
			
 
				+∪φ∈
			
 
				+≈
			
 
				+①
			
 
				+②
			
 
				+②ｃ
			
 
				+③
			
 
				+③］
			
 
				+④
			
 
				+⑤
			
 
				+⑥
			
 
				+⑦
			
 
				+⑧
			
 
				+⑨
			
 
				+⑩
			
 
				+──
			
 
				+■
			
 
				+▲
			
 
				+　
			
 
				+、
			
 
				+。
			
 
				+〈
			
 
				+〉
			
 
				+《
			
 
				+》
			
 
				+》），
			
 
				+」
			
 
				+『
			
 
				+』
			
 
				+【
			
 
				+】
			
 
				+〔
			
 
				+〕
			
 
				+〕〔
			
 
				+㈧
			
 
				+一
			
 
				+一.
			
 
				+一一
			
 
				+一下
			
 
				+一个
			
 
				+一些
			
 
				+一何
			
 
				+一切
			
 
				+一则
			
 
				+一则通过
			
 
				+一天
			
 
				+一定
			
 
				+一方面
			
 
				+一旦
			
 
				+一时
			
 
				+一来
			
 
				+一样
			
 
				+一次
			
 
				+一片
			
 
				+一番
			
 
				+一直
			
 
				+一致
			
 
				+一般
			
 
				+一起
			
 
				+一转眼
			
 
				+一边
			
 
				+一面
			
 
				+七
			
 
				+万一
			
 
				+三
			
 
				+三天两头
			
 
				+三番两次
			
 
				+三番五次
			
 
				+上
			
 
				+上下
			
 
				+上升
			
 
				+上去
			
 
				+上来
			
 
				+上述
			
 
				+上面
			
 
				+下
			
 
				+下列
			
 
				+下去
			
 
				+下来
			
 
				+下面
			
 
				+不
			
 
				+不一
			
 
				+不下
			
 
				+不久
			
 
				+不了
			
 
				+不亦乐乎
			
 
				+不仅
			
 
				+不仅...而且
			
 
				+不仅仅
			
 
				+不仅仅是
			
 
				+不会
			
 
				+不但
			
 
				+不但...而且
			
 
				+不光
			
 
				+不免
			
 
				+不再
			
 
				+不力
			
 
				+不单
			
 
				+不变
			
 
				+不只
			
 
				+不可
			
 
				+不可开交
			
 
				+不可抗拒
			
 
				+不同
			
 
				+不外
			
 
				+不外乎
			
 
				+不够
			
 
				+不大
			
 
				+不如
			
 
				+不妨
			
 
				+不定
			
 
				+不对
			
 
				+不少
			
 
				+不尽
			
 
				+不尽然
			
 
				+不巧
			
 
				+不已
			
 
				+不常
			
 
				+不得
			
 
				+不得不
			
 
				+不得了
			
 
				+不得已
			
 
				+不必
			
 
				+不怎么
			
 
				+不怕
			
 
				+不惟
			
 
				+不成
			
 
				+不拘
			
 
				+不择手段
			
 
				+不敢
			
 
				+不料
			
 
				+不断
			
 
				+不日
			
 
				+不时
			
 
				+不是
			
 
				+不曾
			
 
				+不止
			
 
				+不止一次
			
 
				+不比
			
 
				+不消
			
 
				+不满
			
 
				+不然
			
 
				+不然的话
			
 
				+不特
			
 
				+不独
			
 
				+不由得
			
 
				+不知不觉
			
 
				+不管
			
 
				+不管怎样
			
 
				+不经意
			
 
				+不胜
			
 
				+不能
			
 
				+不能不
			
 
				+不至于
			
 
				+不若
			
 
				+不要
			
 
				+不论
			
 
				+不起
			
 
				+不足
			
 
				+不过
			
 
				+不迭
			
 
				+不问
			
 
				+不限
			
 
				+与
			
 
				+与其
			
 
				+与其说
			
 
				+与否
			
 
				+与此同时
			
 
				+专门
			
 
				+且
			
 
				+且不说
			
 
				+且说
			
 
				+两者
			
 
				+严格
			
 
				+严重
			
 
				+个
			
 
				+个人
			
 
				+个别
			
 
				+中小
			
 
				+中间
			
 
				+丰富
			
 
				+串行
			
 
				+临
			
 
				+临到
			
 
				+为
			
 
				+为主
			
 
				+为了
			
 
				+为什么
			
 
				+为什麽
			
 
				+为何
			
 
				+为止
			
 
				+为此
			
 
				+为着
			
 
				+主张
			
 
				+主要
			
 
				+举凡
			
 
				+举行
			
 
				+乃
			
 
				+乃至
			
 
				+乃至于
			
 
				+么
			
 
				+之
			
 
				+之一
			
 
				+之前
			
 
				+之后
			
 
				+之後
			
 
				+之所以
			
 
				+之类
			
 
				+乌乎
			
 
				+乎
			
 
				+乒
			
 
				+乘
			
 
				+乘势
			
 
				+乘机
			
 
				+乘胜
			
 
				+乘虚
			
 
				+乘隙
			
 
				+九
			
 
				+也
			
 
				+也好
			
 
				+也就是说
			
 
				+也是
			
 
				+也罢
			
 
				+了
			
 
				+了解
			
 
				+争取
			
 
				+二
			
 
				+二来
			
 
				+二话不说
			
 
				+二话没说
			
 
				+于
			
 
				+于是
			
 
				+于是乎
			
 
				+云云
			
 
				+云尔
			
 
				+互
			
 
				+互相
			
 
				+五
			
 
				+些
			
 
				+交口
			
 
				+亦
			
 
				+产生
			
 
				+亲口
			
 
				+亲手
			
 
				+亲眼
			
 
				+亲自
			
 
				+亲身
			
 
				+人
			
 
				+人人
			
 
				+人们
			
 
				+人家
			
 
				+人民
			
 
				+什么
			
 
				+什么样
			
 
				+什麽
			
 
				+仅
			
 
				+仅仅
			
 
				+今
			
 
				+今后
			
 
				+今天
			
 
				+今年
			
 
				+今後
			
 
				+介于
			
 
				+仍
			
 
				+仍旧
			
 
				+仍然
			
 
				+从
			
 
				+从不
			
 
				+从严
			
 
				+从中
			
 
				+从事
			
 
				+从今以后
			
 
				+从优
			
 
				+从古到今
			
 
				+从古至今
			
 
				+从头
			
 
				+从宽
			
 
				+从小
			
 
				+从新
			
 
				+从无到有
			
 
				+从早到晚
			
 
				+从未
			
 
				+从来
			
 
				+从此
			
 
				+从此以后
			
 
				+从而
			
 
				+从轻
			
 
				+从速
			
 
				+从重
			
 
				+他
			
 
				+他人
			
 
				+他们
			
 
				+他是
			
 
				+他的
			
 
				+代替
			
 
				+以
			
 
				+以上
			
 
				+以下
			
 
				+以为
			
 
				+以便
			
 
				+以免
			
 
				+以前
			
 
				+以及
			
 
				+以后
			
 
				+以外
			
 
				+以後
			
 
				+以故
			
 
				+以期
			
 
				+以来
			
 
				+以至
			
 
				+以至于
			
 
				+以致
			
 
				+们
			
 
				+任
			
 
				+任何
			
 
				+任凭
			
 
				+任务
			
 
				+企图
			
 
				+伙同
			
 
				+会
			
 
				+伟大
			
 
				+传
			
 
				+传说
			
 
				+传闻
			
 
				+似乎
			
 
				+似的
			
 
				+但
			
 
				+但凡
			
 
				+但愿
			
 
				+但是
			
 
				+何
			
 
				+何乐而不为
			
 
				+何以
			
 
				+何况
			
 
				+何处
			
 
				+何妨
			
 
				+何尝
			
 
				+何必
			
 
				+何时
			
 
				+何止
			
 
				+何苦
			
 
				+何须
			
 
				+余外
			
 
				+作为
			
 
				+你
			
 
				+你们
			
 
				+你是
			
 
				+你的
			
 
				+使
			
 
				+使得
			
 
				+使用
			
 
				+例如
			
 
				+依
			
 
				+依据
			
 
				+依照
			
 
				+依靠
			
 
				+便
			
 
				+便于
			
 
				+促进
			
 
				+保持
			
 
				+保管
			
 
				+保险
			
 
				+俺
			
 
				+俺们
			
 
				+倍加
			
 
				+倍感
			
 
				+倒不如
			
 
				+倒不如说
			
 
				+倒是
			
 
				+倘
			
 
				+倘使
			
 
				+倘或
			
 
				+倘然
			
 
				+倘若
			
 
				+借
			
 
				+借以
			
 
				+借此
			
 
				+假使
			
 
				+假如
			
 
				+假若
			
 
				+偏偏
			
 
				+做到
			
 
				+偶尔
			
 
				+偶而
			
 
				+傥然
			
 
				+像
			
 
				+儿
			
 
				+允许
			
 
				+元／吨
			
 
				+充其极
			
 
				+充其量
			
 
				+充分
			
 
				+先不先
			
 
				+先后
			
 
				+先後
			
 
				+先生
			
 
				+光
			
 
				+光是
			
 
				+全体
			
 
				+全力
			
 
				+全年
			
 
				+全然
			
 
				+全身心
			
 
				+全部
			
 
				+全都
			
 
				+全面
			
 
				+八
			
 
				+八成
			
 
				+公然
			
 
				+六
			
 
				+兮
			
 
				+共
			
 
				+共同
			
 
				+共总
			
 
				+关于
			
 
				+其
			
 
				+其一
			
 
				+其中
			
 
				+其二
			
 
				+其他
			
 
				+其余
			
 
				+其后
			
 
				+其它
			
 
				+其实
			
 
				+其次
			
 
				+具体
			
 
				+具体地说
			
 
				+具体来说
			
 
				+具体说来
			
 
				+具有
			
 
				+兼之
			
 
				+内
			
 
				+再
			
 
				+再其次
			
 
				+再则
			
 
				+再有
			
 
				+再次
			
 
				+再者
			
 
				+再者说
			
 
				+再说
			
 
				+冒
			
 
				+冲
			
 
				+决不
			
 
				+决定
			
 
				+决非
			
 
				+况且
			
 
				+准备
			
 
				+凑巧
			
 
				+凝神
			
 
				+几
			
 
				+几乎
			
 
				+几度
			
 
				+几时
			
 
				+几番
			
 
				+几经
			
 
				+凡
			
 
				+凡是
			
 
				+凭
			
 
				+凭借
			
 
				+出
			
 
				+出于
			
 
				+出去
			
 
				+出来
			
 
				+出现
			
 
				+分别
			
 
				+分头
			
 
				+分期
			
 
				+分期分批
			
 
				+切
			
 
				+切不可
			
 
				+切切
			
 
				+切勿
			
 
				+切莫
			
 
				+则
			
 
				+则甚
			
 
				+刚
			
 
				+刚好
			
 
				+刚巧
			
 
				+刚才
			
 
				+初
			
 
				+别
			
 
				+别人
			
 
				+别处
			
 
				+别是
			
 
				+别的
			
 
				+别管
			
 
				+别说
			
 
				+到
			
 
				+到了儿
			
 
				+到处
			
 
				+到头
			
 
				+到头来
			
 
				+到底
			
 
				+到目前为止
			
 
				+前后
			
 
				+前此
			
 
				+前者
			
 
				+前进
			
 
				+前面
			
 
				+加上
			
 
				+加之
			
 
				+加以
			
 
				+加入
			
 
				+加强
			
 
				+动不动
			
 
				+动辄
			
 
				+勃然
			
 
				+匆匆
			
 
				+十分
			
 
				+千
			
 
				+千万
			
 
				+千万千万
			
 
				+半
			
 
				+单
			
 
				+单单
			
 
				+单纯
			
 
				+即
			
 
				+即令
			
 
				+即使
			
 
				+即便
			
 
				+即刻
			
 
				+即如
			
 
				+即将
			
 
				+即或
			
 
				+即是说
			
 
				+即若
			
 
				+却
			
 
				+却不
			
 
				+历
			
 
				+原来
			
 
				+去
			
 
				+又
			
 
				+又及
			
 
				+及
			
 
				+及其
			
 
				+及时
			
 
				+及至
			
 
				+双方
			
 
				+反之
			
 
				+反之亦然
			
 
				+反之则
			
 
				+反倒
			
 
				+反倒是
			
 
				+反应
			
 
				+反手
			
 
				+反映
			
 
				+反而
			
 
				+反过来
			
 
				+反过来说
			
 
				+取得
			
 
				+取道
			
 
				+受到
			
 
				+变成
			
 
				+古来
			
 
				+另
			
 
				+另一个
			
 
				+另一方面
			
 
				+另外
			
 
				+另悉
			
 
				+另方面
			
 
				+另行
			
 
				+只
			
 
				+只当
			
 
				+只怕
			
 
				+只是
			
 
				+只有
			
 
				+只消
			
 
				+只要
			
 
				+只限
			
 
				+叫
			
 
				+叫做
			
 
				+召开
			
 
				+叮咚
			
 
				+叮当
			
 
				+可
			
 
				+可以
			
 
				+可好
			
 
				+可是
			
 
				+可能
			
 
				+可见
			
 
				+各
			
 
				+各个
			
 
				+各人
			
 
				+各位
			
 
				+各地
			
 
				+各式
			
 
				+各种
			
 
				+各级
			
 
				+各自
			
 
				+合理
			
 
				+同
			
 
				+同一
			
 
				+同时
			
 
				+同样
			
 
				+后
			
 
				+后来
			
 
				+后者
			
 
				+后面
			
 
				+向
			
 
				+向使
			
 
				+向着
			
 
				+吓
			
 
				+吗
			
 
				+否则
			
 
				+吧
			
 
				+吧哒
			
 
				+吱
			
 
				+呀
			
 
				+呃
			
 
				+呆呆地
			
 
				+呐
			
 
				+呕
			
 
				+呗
			
 
				+呜
			
 
				+呜呼
			
 
				+呢
			
 
				+周围
			
 
				+呵
			
 
				+呵呵
			
 
				+呸
			
 
				+呼哧
			
 
				+呼啦
			
 
				+咋
			
 
				+和
			
 
				+咚
			
 
				+咦
			
 
				+咧
			
 
				+咱
			
 
				+咱们
			
 
				+咳
			
 
				+哇
			
 
				+哈
			
 
				+哈哈
			
 
				+哉
			
 
				+哎
			
 
				+哎呀
			
 
				+哎哟
			
 
				+哗
			
 
				+哗啦
			
 
				+哟
			
 
				+哦
			
 
				+哩
			
 
				+哪
			
 
				+哪个
			
 
				+哪些
			
 
				+哪儿
			
 
				+哪天
			
 
				+哪年
			
 
				+哪怕
			
 
				+哪样
			
 
				+哪边
			
 
				+哪里
			
 
				+哼
			
 
				+哼唷
			
 
				+唉
			
 
				+唯有
			
 
				+啊
			
 
				+啊呀
			
 
				+啊哈
			
 
				+啊哟
			
 
				+啐
			
 
				+啥
			
 
				+啦
			
 
				+啪达
			
 
				+啷当
			
 
				+喀
			
 
				+喂
			
 
				+喏
			
 
				+喔唷
			
 
				+喽
			
 
				+嗡
			
 
				+嗡嗡
			
 
				+嗬
			
 
				+嗯
			
 
				+嗳
			
 
				+嘎
			
 
				+嘎嘎
			
 
				+嘎登
			
 
				+嘘
			
 
				+嘛
			
 
				+嘻
			
 
				+嘿
			
 
				+嘿嘿
			
 
				+四
			
 
				+因
			
 
				+因为
			
 
				+因了
			
 
				+因此
			
 
				+因着
			
 
				+因而
			
 
				+固
			
 
				+固然
			
 
				+在
			
 
				+在下
			
 
				+在于
			
 
				+地
			
 
				+均
			
 
				+坚决
			
 
				+坚持
			
 
				+基于
			
 
				+基本
			
 
				+基本上
			
 
				+处在
			
 
				+处处
			
 
				+处理
			
 
				+复杂
			
 
				+多
			
 
				+多么
			
 
				+多亏
			
 
				+多多
			
 
				+多多少少
			
 
				+多多益善
			
 
				+多少
			
 
				+多年前
			
 
				+多年来
			
 
				+多数
			
 
				+多次
			
 
				+够瞧的
			
 
				+大
			
 
				+大不了
			
 
				+大举
			
 
				+大事
			
 
				+大体
			
 
				+大体上
			
 
				+大凡
			
 
				+大力
			
 
				+大多
			
 
				+大多数
			
 
				+大大
			
 
				+大家
			
 
				+大张旗鼓
			
 
				+大批
			
 
				+大抵
			
 
				+大概
			
 
				+大略
			
 
				+大约
			
 
				+大致
			
 
				+大都
			
 
				+大量
			
 
				+大面儿上
			
 
				+失去
			
 
				+奇
			
 
				+奈
			
 
				+奋勇
			
 
				+她
			
 
				+她们
			
 
				+她是
			
 
				+她的
			
 
				+好
			
 
				+好在
			
 
				+好的
			
 
				+好象
			
 
				+如
			
 
				+如上
			
 
				+如上所述
			
 
				+如下
			
 
				+如今
			
 
				+如何
			
 
				+如其
			
 
				+如前所述
			
 
				+如同
			
 
				+如常
			
 
				+如是
			
 
				+如期
			
 
				+如果
			
 
				+如次
			
 
				+如此
			
 
				+如此等等
			
 
				+如若
			
 
				+始而
			
 
				+姑且
			
 
				+存在
			
 
				+存心
			
 
				+孰料
			
 
				+孰知
			
 
				+宁
			
 
				+宁可
			
 
				+宁愿
			
 
				+宁肯
			
 
				+它
			
 
				+它们
			
 
				+它们的
			
 
				+它是
			
 
				+它的
			
 
				+安全
			
 
				+完全
			
 
				+完成
			
 
				+定
			
 
				+实现
			
 
				+实际
			
 
				+宣布
			
 
				+容易
			
 
				+密切
			
 
				+对
			
 
				+对于
			
 
				+对应
			
 
				+对待
			
 
				+对方
			
 
				+对比
			
 
				+将
			
 
				+将才
			
 
				+将要
			
 
				+将近
			
 
				+小
			
 
				+少数
			
 
				+尔
			
 
				+尔后
			
 
				+尔尔
			
 
				+尔等
			
 
				+尚且
			
 
				+尤其
			
 
				+就
			
 
				+就地
			
 
				+就是
			
 
				+就是了
			
 
				+就是说
			
 
				+就此
			
 
				+就算
			
 
				+就要
			
 
				+尽
			
 
				+尽可能
			
 
				+尽如人意
			
 
				+尽心尽力
			
 
				+尽心竭力
			
 
				+尽快
			
 
				+尽早
			
 
				+尽然
			
 
				+尽管
			
 
				+尽管如此
			
 
				+尽量
			
 
				+局外
			
 
				+居然
			
 
				+届时
			
 
				+属于
			
 
				+屡
			
 
				+屡屡
			
 
				+屡次
			
 
				+屡次三番
			
 
				+岂
			
 
				+岂但
			
 
				+岂止
			
 
				+岂非
			
 
				+川流不息
			
 
				+左右
			
 
				+巨大
			
 
				+巩固
			
 
				+差一点
			
 
				+差不多
			
 
				+己
			
 
				+已
			
 
				+已矣
			
 
				+已经
			
 
				+巴
			
 
				+巴巴
			
 
				+带
			
 
				+帮助
			
 
				+常
			
 
				+常常
			
 
				+常言说
			
 
				+常言说得好
			
 
				+常言道
			
 
				+平素
			
 
				+年复一年
			
 
				+并
			
 
				+并不
			
 
				+并不是
			
 
				+并且
			
 
				+并排
			
 
				+并无
			
 
				+并没
			
 
				+并没有
			
 
				+并肩
			
 
				+并非
			
 
				+广大
			
 
				+广泛
			
 
				+应当
			
 
				+应用
			
 
				+应该
			
 
				+庶乎
			
 
				+庶几
			
 
				+开外
			
 
				+开始
			
 
				+开展
			
 
				+引起
			
 
				+弗
			
 
				+弹指之间
			
 
				+强烈
			
 
				+强调
			
 
				+归
			
 
				+归根到底
			
 
				+归根结底
			
 
				+归齐
			
 
				+当
			
 
				+当下
			
 
				+当中
			
 
				+当儿
			
 
				+当前
			
 
				+当即
			
 
				+当口儿
			
 
				+当地
			
 
				+当场
			
 
				+当头
			
 
				+当庭
			
 
				+当时
			
 
				+当然
			
 
				+当真
			
 
				+当着
			
 
				+形成
			
 
				+彻夜
			
 
				+彻底
			
 
				+彼
			
 
				+彼时
			
 
				+彼此
			
 
				+往
			
 
				+往往
			
 
				+待
			
 
				+待到
			
 
				+很
			
 
				+很多
			
 
				+很少
			
 
				+後来
			
 
				+後面
			
 
				+得
			
 
				+得了
			
 
				+得出
			
 
				+得到
			
 
				+得天独厚
			
 
				+得起
			
 
				+心里
			
 
				+必
			
 
				+必定
			
 
				+必将
			
 
				+必然
			
 
				+必要
			
 
				+必须
			
 
				+快
			
 
				+快要
			
 
				+忽地
			
 
				+忽然
			
 
				+怎
			
 
				+怎么
			
 
				+怎么办
			
 
				+怎么样
			
 
				+怎奈
			
 
				+怎样
			
 
				+怎麽
			
 
				+怕
			
 
				+急匆匆
			
 
				+怪
			
 
				+怪不得
			
 
				+总之
			
 
				+总是
			
 
				+总的来看
			
 
				+总的来说
			
 
				+总的说来
			
 
				+总结
			
 
				+总而言之
			
 
				+恍然
			
 
				+恐怕
			
 
				+恰似
			
 
				+恰好
			
 
				+恰如
			
 
				+恰巧
			
 
				+恰恰
			
 
				+恰恰相反
			
 
				+恰逢
			
 
				+您
			
 
				+您们
			
 
				+您是
			
 
				+惟其
			
 
				+惯常
			
 
				+意思
			
 
				+愤然
			
 
				+愿意
			
 
				+慢说
			
 
				+成为
			
 
				+成年
			
 
				+成年累月
			
 
				+成心
			
 
				+我
			
 
				+我们
			
 
				+我是
			
 
				+我的
			
 
				+或
			
 
				+或则
			
 
				+或多或少
			
 
				+或是
			
 
				+或曰
			
 
				+或者
			
 
				+或许
			
 
				+战斗
			
 
				+截然
			
 
				+截至
			
 
				+所
			
 
				+所以
			
 
				+所在
			
 
				+所幸
			
 
				+所有
			
 
				+所谓
			
 
				+才
			
 
				+才能
			
 
				+扑通
			
 
				+打
			
 
				+打从
			
 
				+打开天窗说亮话
			
 
				+扩大
			
 
				+把
			
 
				+抑或
			
 
				+抽冷子
			
 
				+拦腰
			
 
				+拿
			
 
				+按
			
 
				+按时
			
 
				+按期
			
 
				+按照
			
 
				+按理
			
 
				+按说
			
 
				+挨个
			
 
				+挨家挨户
			
 
				+挨次
			
 
				+挨着
			
 
				+挨门挨户
			
 
				+挨门逐户
			
 
				+换句话说
			
 
				+换言之
			
 
				+据
			
 
				+据实
			
 
				+据悉
			
 
				+据我所知
			
 
				+据此
			
 
				+据称
			
 
				+据说
			
 
				+掌握
			
 
				+接下来
			
 
				+接着
			
 
				+接著
			
 
				+接连不断
			
 
				+放量
			
 
				+故
			
 
				+故意
			
 
				+故此
			
 
				+故而
			
 
				+敞开儿
			
 
				+敢
			
 
				+敢于
			
 
				+敢情
			
 
				+数/
			
 
				+整个
			
 
				+断然
			
 
				+方
			
 
				+方便
			
 
				+方才
			
 
				+方能
			
 
				+方面
			
 
				+旁人
			
 
				+无
			
 
				+无宁
			
 
				+无法
			
 
				+无论
			
 
				+既
			
 
				+既...又
			
 
				+既往
			
 
				+既是
			
 
				+既然
			
 
				+日复一日
			
 
				+日渐
			
 
				+日益
			
 
				+日臻
			
 
				+日见
			
 
				+时候
			
 
				+昂然
			
 
				+明显
			
 
				+明确
			
 
				+是
			
 
				+是不是
			
 
				+是以
			
 
				+是否
			
 
				+是的
			
 
				+显然
			
 
				+显著
			
 
				+普通
			
 
				+普遍
			
 
				+暗中
			
 
				+暗地里
			
 
				+暗自
			
 
				+更
			
 
				+更为
			
 
				+更加
			
 
				+更进一步
			
 
				+曾
			
 
				+曾经
			
 
				+替
			
 
				+替代
			
 
				+最
			
 
				+最后
			
 
				+最大
			
 
				+最好
			
 
				+最後
			
 
				+最近
			
 
				+最高
			
 
				+有
			
 
				+有些
			
 
				+有关
			
 
				+有利
			
 
				+有力
			
 
				+有及
			
 
				+有所
			
 
				+有效
			
 
				+有时
			
 
				+有点
			
 
				+有的
			
 
				+有的是
			
 
				+有着
			
 
				+有著
			
 
				+望
			
 
				+朝
			
 
				+朝着
			
 
				+末##末
			
 
				+本
			
 
				+本人
			
 
				+本地
			
 
				+本着
			
 
				+本身
			
 
				+权时
			
 
				+来
			
 
				+来不及
			
 
				+来得及
			
 
				+来看
			
 
				+来着
			
 
				+来自
			
 
				+来讲
			
 
				+来说
			
 
				+极
			
 
				+极为
			
 
				+极了
			
 
				+极其
			
 
				+极力
			
 
				+极大
			
 
				+极度
			
 
				+极端
			
 
				+构成
			
 
				+果然
			
 
				+果真
			
 
				+某
			
 
				+某个
			
 
				+某些
			
 
				+某某
			
 
				+根据
			
 
				+根本
			
 
				+格外
			
 
				+梆
			
 
				+概
			
 
				+次第
			
 
				+欢迎
			
 
				+欤
			
 
				+正值
			
 
				+正在
			
 
				+正如
			
 
				+正巧
			
 
				+正常
			
 
				+正是
			
 
				+此
			
 
				+此中
			
 
				+此后
			
 
				+此地
			
 
				+此处
			
 
				+此外
			
 
				+此时
			
 
				+此次
			
 
				+此间
			
 
				+殆
			
 
				+毋宁
			
 
				+每
			
 
				+每个
			
 
				+每天
			
 
				+每年
			
 
				+每当
			
 
				+每时每刻
			
 
				+每每
			
 
				+每逢
			
 
				+比
			
 
				+比及
			
 
				+比如
			
 
				+比如说
			
 
				+比方
			
 
				+比照
			
 
				+比起
			
 
				+比较
			
 
				+毕竟
			
 
				+毫不
			
 
				+毫无
			
 
				+毫无例外
			
 
				+毫无保留地
			
 
				+汝
			
 
				+沙沙
			
 
				+没
			
 
				+没奈何
			
 
				+没有
			
 
				+沿
			
 
				+沿着
			
 
				+注意
			
 
				+活
			
 
				+深入
			
 
				+清楚
			
 
				+满
			
 
				+满足
			
 
				+漫说
			
 
				+焉
			
 
				+然
			
 
				+然则
			
 
				+然后
			
 
				+然後
			
 
				+然而
			
 
				+照
			
 
				+照着
			
 
				+牢牢
			
 
				+特别是
			
 
				+特殊
			
 
				+特点
			
 
				+犹且
			
 
				+犹自
			
 
				+独
			
 
				+独自
			
 
				+猛然
			
 
				+猛然间
			
 
				+率尔
			
 
				+率然
			
 
				+现代
			
 
				+现在
			
 
				+理应
			
 
				+理当
			
 
				+理该
			
 
				+瑟瑟
			
 
				+甚且
			
 
				+甚么
			
 
				+甚或
			
 
				+甚而
			
 
				+甚至
			
 
				+甚至于
			
 
				+用
			
 
				+用来
			
 
				+甫
			
 
				+甭
			
 
				+由
			
 
				+由于
			
 
				+由是
			
 
				+由此
			
 
				+由此可见
			
 
				+略
			
 
				+略为
			
 
				+略加
			
 
				+略微
			
 
				+白
			
 
				+白白
			
 
				+的
			
 
				+的确
			
 
				+的话
			
 
				+皆可
			
 
				+目前
			
 
				+直到
			
 
				+直接
			
 
				+相似
			
 
				+相信
			
 
				+相反
			
 
				+相同
			
 
				+相对
			
 
				+相对而言
			
 
				+相应
			
 
				+相当
			
 
				+相等
			
 
				+省得
			
 
				+看
			
 
				+看上去
			
 
				+看出
			
 
				+看到
			
 
				+看来
			
 
				+看样子
			
 
				+看看
			
 
				+看见
			
 
				+看起来
			
 
				+真是
			
 
				+真正
			
 
				+眨眼
			
 
				+着
			
 
				+着呢
			
 
				+矣
			
 
				+矣乎
			
 
				+矣哉
			
 
				+知道
			
 
				+砰
			
 
				+确定
			
 
				+碰巧
			
 
				+社会主义
			
 
				+离
			
 
				+种
			
 
				+积极
			
 
				+移动
			
 
				+究竟
			
 
				+穷年累月
			
 
				+突出
			
 
				+突然
			
 
				+窃
			
 
				+立
			
 
				+立刻
			
 
				+立即
			
 
				+立地
			
 
				+立时
			
 
				+立马
			
 
				+竟
			
 
				+竟然
			
 
				+竟而
			
 
				+第
			
 
				+第二
			
 
				+等
			
 
				+等到
			
 
				+等等
			
 
				+策略地
			
 
				+简直
			
 
				+简而言之
			
 
				+简言之
			
 
				+管
			
 
				+类如
			
 
				+粗
			
 
				+精光
			
 
				+紧接着
			
 
				+累年
			
 
				+累次
			
 
				+纯
			
 
				+纯粹
			
 
				+纵
			
 
				+纵令
			
 
				+纵使
			
 
				+纵然
			
 
				+练习
			
 
				+组成
			
 
				+经
			
 
				+经常
			
 
				+经过
			
 
				+结合
			
 
				+结果
			
 
				+给
			
 
				+绝
			
 
				+绝不
			
 
				+绝对
			
 
				+绝非
			
 
				+绝顶
			
 
				+继之
			
 
				+继后
			
 
				+继续
			
 
				+继而
			
 
				+维持
			
 
				+综上所述
			
 
				+缕缕
			
 
				+罢了
			
 
				+老
			
 
				+老大
			
 
				+老是
			
 
				+老老实实
			
 
				+考虑
			
 
				+者
			
 
				+而
			
 
				+而且
			
 
				+而况
			
 
				+而又
			
 
				+而后
			
 
				+而外
			
 
				+而已
			
 
				+而是
			
 
				+而言
			
 
				+而论
			
 
				+联系
			
 
				+联袂
			
 
				+背地里
			
 
				+背靠背
			
 
				+能
			
 
				+能否
			
 
				+能够
			
 
				+腾
			
 
				+自
			
 
				+自个儿
			
 
				+自从
			
 
				+自各儿
			
 
				+自后
			
 
				+自家
			
 
				+自己
			
 
				+自打
			
 
				+自身
			
 
				+臭
			
 
				+至
			
 
				+至于
			
 
				+至今
			
 
				+至若
			
 
				+致
			
 
				+般的
			
 
				+良好
			
 
				+若
			
 
				+若夫
			
 
				+若是
			
 
				+若果
			
 
				+若非
			
 
				+范围
			
 
				+莫
			
 
				+莫不
			
 
				+莫不然
			
 
				+莫如
			
 
				+莫若
			
 
				+莫非
			
 
				+获得
			
 
				+藉以
			
 
				+虽
			
 
				+虽则
			
 
				+虽然
			
 
				+虽说
			
 
				+蛮
			
 
				+行为
			
 
				+行动
			
 
				+表明
			
 
				+表示
			
 
				+被
			
 
				+要
			
 
				+要不
			
 
				+要不是
			
 
				+要不然
			
 
				+要么
			
 
				+要是
			
 
				+要求
			
 
				+见
			
 
				+规定
			
 
				+觉得
			
 
				+譬喻
			
 
				+譬如
			
 
				+认为
			
 
				+认真
			
 
				+认识
			
 
				+让
			
 
				+许多
			
 
				+论
			
 
				+论说
			
 
				+设使
			
 
				+设或
			
 
				+设若
			
 
				+诚如
			
 
				+诚然
			
 
				+话说
			
 
				+该
			
 
				+该当
			
 
				+说明
			
 
				+说来
			
 
				+说说
			
 
				+请勿
			
 
				+诸
			
 
				+诸位
			
 
				+诸如
			
 
				+谁
			
 
				+谁人
			
 
				+谁料
			
 
				+谁知
			
 
				+谨
			
 
				+豁然
			
 
				+贼死
			
 
				+赖以
			
 
				+赶
			
 
				+赶快
			
 
				+赶早不赶晚
			
 
				+起
			
 
				+起先
			
 
				+起初
			
 
				+起头
			
 
				+起来
			
 
				+起见
			
 
				+起首
			
 
				+趁
			
 
				+趁便
			
 
				+趁势
			
 
				+趁早
			
 
				+趁机
			
 
				+趁热
			
 
				+趁着
			
 
				+越是
			
 
				+距
			
 
				+跟
			
 
				+路经
			
 
				+转动
			
 
				+转变
			
 
				+转贴
			
 
				+轰然
			
 
				+较
			
 
				+较为
			
 
				+较之
			
 
				+较比
			
 
				+边
			
 
				+达到
			
 
				+达旦
			
 
				+迄
			
 
				+迅速
			
 
				+过
			
 
				+过于
			
 
				+过去
			
 
				+过来
			
 
				+运用
			
 
				+近
			
 
				+近几年来
			
 
				+近年来
			
 
				+近来
			
 
				+还
			
 
				+还是
			
 
				+还有
			
 
				+还要
			
 
				+这
			
 
				+这一来
			
 
				+这个
			
 
				+这么
			
 
				+这么些
			
 
				+这么样
			
 
				+这么点儿
			
 
				+这些
			
 
				+这会儿
			
 
				+这儿
			
 
				+这就是说
			
 
				+这时
			
 
				+这样
			
 
				+这次
			
 
				+这点
			
 
				+这种
			
 
				+这般
			
 
				+这边
			
 
				+这里
			
 
				+这麽
			
 
				+进入
			
 
				+进去
			
 
				+进来
			
 
				+进步
			
 
				+进而
			
 
				+进行
			
 
				+连
			
 
				+连同
			
 
				+连声
			
 
				+连日
			
 
				+连日来
			
 
				+连袂
			
 
				+连连
			
 
				+迟早
			
 
				+迫于
			
 
				+适应
			
 
				+适当
			
 
				+适用
			
 
				+逐步
			
 
				+逐渐
			
 
				+通常
			
 
				+通过
			
 
				+造成
			
 
				+逢
			
 
				+遇到
			
 
				+遭到
			
 
				+遵循
			
 
				+遵照
			
 
				+避免
			
 
				+那
			
 
				+那个
			
 
				+那么
			
 
				+那么些
			
 
				+那么样
			
 
				+那些
			
 
				+那会儿
			
 
				+那儿
			
 
				+那时
			
 
				+那末
			
 
				+那样
			
 
				+那般
			
 
				+那边
			
 
				+那里
			
 
				+那麽
			
 
				+部分
			
 
				+都
			
 
				+鄙人
			
 
				+采取
			
 
				+里面
			
 
				+重大
			
 
				+重新
			
 
				+重要
			
 
				+鉴于
			
 
				+针对
			
 
				+长期以来
			
 
				+长此下去
			
 
				+长线
			
 
				+长话短说
			
 
				+问题
			
 
				+间或
			
 
				+防止
			
 
				+阿
			
 
				+附近
			
 
				+陈年
			
 
				+限制
			
 
				+陡然
			
 
				+除
			
 
				+除了
			
 
				+除却
			
 
				+除去
			
 
				+除外
			
 
				+除开
			
 
				+除此
			
 
				+除此之外
			
 
				+除此以外
			
 
				+除此而外
			
 
				+除非
			
 
				+随
			
 
				+随后
			
 
				+随时
			
 
				+随着
			
 
				+随著
			
 
				+隔夜
			
 
				+隔日
			
 
				+难得
			
 
				+难怪
			
 
				+难说
			
 
				+难道
			
 
				+难道说
			
 
				+集中
			
 
				+零
			
 
				+需要
			
 
				+非但
			
 
				+非常
			
 
				+非徒
			
 
				+非得
			
 
				+非特
			
 
				+非独
			
 
				+靠
			
 
				+顶多
			
 
				+顷
			
 
				+顷刻
			
 
				+顷刻之间
			
 
				+顷刻间
			
 
				+顺
			
 
				+顺着
			
 
				+顿时
			
 
				+颇
			
 
				+风雨无阻
			
 
				+饱
			
 
				+首先
			
 
				+马上
			
 
				+高低
			
 
				+高兴
			
 
				+默然
			
 
				+默默地
			
 
				+齐
			
 
				+︿
			
 
				+！
			
 
				+＃
			
 
				+＄
			
 
				+％
			
 
				+＆
			
 
				+＇
			
 
				+（
			
 
				+）
			
 
				+）÷（１－
			
 
				+）、
			
 
				+＊
			
 
				+＋
			
 
				+＋ξ
			
 
				+＋＋
			
 
				+，
			
 
				+，也
			
 
				+－
			
 
				+－β
			
 
				+－－
			
 
				+－［＊］－
			
 
				+．
			
 
				+／
			
 
				+０
			
 
				+０：２
			
 
				+１
			
 
				+１．
			
 
				+１２％
			
 
				+２
			
 
				+２．３％
			
 
				+３
			
 
				+４
			
 
				+５
			
 
				+５：０
			
 
				+６
			
 
				+７
			
 
				+８
			
 
				+９
			
 
				+：
			
 
				+；
			
 
				+＜
			
 
				+＜±
			
 
				+＜Δ
			
 
				+＜λ
			
 
				+＜φ
			
 
				+＜＜
			
 
				+＝
			
 
				+＝″
			
 
				+＝☆
			
 
				+＝（
			
 
				+＝－
			
 
				+＝［
			
 
				+＝｛
			
 
				+＞
			
 
				+＞λ
			
 
				+？
			
 
				+＠
			
 
				+Ａ
			
 
				+ＬＩ
			
 
				+Ｒ．Ｌ．
			
 
				+ＺＸＦＩＴＬ
			
 
				+［
			
 
				+［①①］
			
 
				+［①②］
			
 
				+［①③］
			
 
				+［①④］
			
 
				+［①⑤］
			
 
				+［①⑥］
			
 
				+［①⑦］
			
 
				+［①⑧］
			
 
				+［①⑨］
			
 
				+［①Ａ］
			
 
				+［①Ｂ］
			
 
				+［①Ｃ］
			
 
				+［①Ｄ］
			
 
				+［①Ｅ］
			
 
				+［①］
			
 
				+［①ａ］
			
 
				+［①ｃ］
			
 
				+［①ｄ］
			
 
				+［①ｅ］
			
 
				+［①ｆ］
			
 
				+［①ｇ］
			
 
				+［①ｈ］
			
 
				+［①ｉ］
			
 
				+［①ｏ］
			
 
				+［②
			
 
				+［②①］
			
 
				+［②②］
			
 
				+［②③］
			
 
				+［②④
			
 
				+［②⑤］
			
 
				+［②⑥］
			
 
				+［②⑦］
			
 
				+［②⑧］
			
 
				+［②⑩］
			
 
				+［②Ｂ］
			
 
				+［②Ｇ］
			
 
				+［②］
			
 
				+［②ａ］
			
 
				+［②ｂ］
			
 
				+［②ｃ］
			
 
				+［②ｄ］
			
 
				+［②ｅ］
			
 
				+［②ｆ］
			
 
				+［②ｇ］
			
 
				+［②ｈ］
			
 
				+［②ｉ］
			
 
				+［②ｊ］
			
 
				+［③①］
			
 
				+［③⑩］
			
 
				+［③Ｆ］
			
 
				+［③］
			
 
				+［③ａ］
			
 
				+［③ｂ］
			
 
				+［③ｃ］
			
 
				+［③ｄ］
			
 
				+［③ｅ］
			
 
				+［③ｇ］
			
 
				+［③ｈ］
			
 
				+［④］
			
 
				+［④ａ］
			
 
				+［④ｂ］
			
 
				+［④ｃ］
			
 
				+［④ｄ］
			
 
				+［④ｅ］
			
 
				+［⑤］
			
 
				+［⑤］］
			
 
				+［⑤ａ］
			
 
				+［⑤ｂ］
			
 
				+［⑤ｄ］
			
 
				+［⑤ｅ］
			
 
				+［⑤ｆ］
			
 
				+［⑥］
			
 
				+［⑦］
			
 
				+［⑧］
			
 
				+［⑨］
			
 
				+［⑩］
			
 
				+［＊］
			
 
				+［－
			
 
				+［］
			
 
				+］
			
 
				+］∧′＝［
			
 
				+］［
			
 
				+＿
			
 
				+ａ］
			
 
				+ｂ］
			
 
				+ｃ］
			
 
				+ｅ］
			
 
				+ｆ］
			
 
				+ｎｇ昉
			
 
				+｛
			
 
				+｛－
			
 
				+｜
			
 
				+｝
			
 
				+｝＞
			
 
				+～
			
 
				+～±
			
 
				+～＋
			
 
				+￥
			
--- a/merge.py
+++ b/merge.py
@@ -0,0 +1,70 @@
 
				+# -*- coding: utf-8 -*-
			
 
				+
			
 
				+import os
			
 
				+import zipfile
			
 
				+
			
 
				+EXCLUDE_FILES = ['打开乱码如何处理？.txt']
			
 
				+DATA_DIR = "E:\Download\长尾关键词\普通-p"
			
 
				+
			
 
				+def get_files(path):
			
 
				+    '''
			
 
				+    读取文件夹下的文件名称
			
 
				+    '''
			
 
				+    file_list = []
			
 
				+    for file in os.listdir(path):
			
 
				+        file_list.append(os.path.join(path,file))
			
 
				+    return file_list
			
 
				+
			
 
				+def merge_file_content(dir_path, dest_file = './merge.txt', exclude_file=EXCLUDE_FILES):
			
 
				+    """
			
 
				+    合并文件下的所有文件中的内容（仅限关键词）
			
 
				+
			
 
				+    Parameters
			
 
				+    ----------
			
 
				+    dir_path : string
			
 
				+        待读取的文件夹
			
 
				+
			
 
				+    dest_file : string 
			
 
				+        合并后输出的文件
			
 
				+
			
 
				+    exclude_file : list
			
 
				+        跳过压缩文件中的文件
			
 
				+    ----------
			
 
				+    """
			
 
				+
			
 
				+    print("----------- 开始 -----------")
			
 
				+
			
 
				+    # 获取文件列表
			
 
				+    print("读取文件列表")
			
 
				+    files = get_files(dir_path)
			
 
				+
			
 
				+    with open(dest_file, "w", encoding="utf-8") as f:
			
 
				+
			
 
				+        for file in files:
			
 
				+            zfile = zipfile.ZipFile(file)
			
 
				+            filenames = zfile.namelist()
			
 
				+            for filename in filenames:
			
 
				+
			
 
				+                # 重新编码文件名为正确形式
			
 
				+                realname = filename.encode('cp437').decode('gbk')
			
 
				+                
			
 
				+                # 排除无效文件
			
 
				+                if realname in exclude_file:
			
 
				+                    continue
			
 
				+
			
 
				+                print("正在处理文件:", realname)
			
 
				+
			
 
				+                # 读取压缩文件中的文件
			
 
				+                with zfile.open(filename) as file_content:
			
 
				+                    lines = file_content.readlines()
			
 
				+                    # 跳过开头两行
			
 
				+                    for line in lines[2:]:
			
 
				+                        split = line.decode("gbk").split(",")
			
 
				+                        # 只需要第一列的数据
			
 
				+                        f.write(split[0])
			
 
				+                        f.write("\n")
			
 
				+
			
 
				+    print("----------- 结束 -----------")
			
 
				+
			
 
				+merge_file_content(DATA_DIR)
			
 
				+        
			
--- a/长尾关键词分析.ipynb
+++ b/长尾关键词分析.ipynb
@@ -0,0 +1,363 @@
 
				+{
			
 
				+ "cells": [
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 1,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "import pandas as pd\n",
			
 
				+    "import os\n",
			
 
				+    "\n",
			
 
				+    "ORIG_FILE = \"./data/范用性关键词-分词结果.csv\"\n",
			
 
				+    "DEST_FILE = \"./data/范用性关键词-分词结果-过滤停用词.csv\"\n",
			
 
				+    "DEST_FILE_FILTER = \"./data/范用性关键词-分词结果-过滤停用词-词频大于300.csv\"\n",
			
 
				+    "STOP_WORD_DIR = \"./data/stopwords\""
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 2,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "df = pd.read_csv(ORIG_FILE, names=['key','count'])"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 3,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [
			
 
				+    {
			
 
				+     "data": {
			
 
				+      "text/html": [
			
 
				+       "<div>\n",
			
 
				+       "<style scoped>\n",
			
 
				+       "    .dataframe tbody tr th:only-of-type {\n",
			
 
				+       "        vertical-align: middle;\n",
			
 
				+       "    }\n",
			
 
				+       "\n",
			
 
				+       "    .dataframe tbody tr th {\n",
			
 
				+       "        vertical-align: top;\n",
			
 
				+       "    }\n",
			
 
				+       "\n",
			
 
				+       "    .dataframe thead th {\n",
			
 
				+       "        text-align: right;\n",
			
 
				+       "    }\n",
			
 
				+       "</style>\n",
			
 
				+       "<table border=\"1\" class=\"dataframe\">\n",
			
 
				+       "  <thead>\n",
			
 
				+       "    <tr style=\"text-align: right;\">\n",
			
 
				+       "      <th></th>\n",
			
 
				+       "      <th>key</th>\n",
			
 
				+       "      <th>count</th>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "  </thead>\n",
			
 
				+       "  <tbody>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>0</th>\n",
			
 
				+       "      <td>怎么</td>\n",
			
 
				+       "      <td>1051516</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>1</th>\n",
			
 
				+       "      <td>的</td>\n",
			
 
				+       "      <td>123009</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>2</th>\n",
			
 
				+       "      <td>怎么办</td>\n",
			
 
				+       "      <td>93937</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>3</th>\n",
			
 
				+       "      <td>怎么样</td>\n",
			
 
				+       "      <td>91070</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>4</th>\n",
			
 
				+       "      <td>做</td>\n",
			
 
				+       "      <td>63034</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>...</th>\n",
			
 
				+       "      <td>...</td>\n",
			
 
				+       "      <td>...</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>116625</th>\n",
			
 
				+       "      <td>做文</td>\n",
			
 
				+       "      <td>1</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>116626</th>\n",
			
 
				+       "      <td>提微商</td>\n",
			
 
				+       "      <td>1</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>116627</th>\n",
			
 
				+       "      <td>仰卧</td>\n",
			
 
				+       "      <td>1</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>116628</th>\n",
			
 
				+       "      <td>起坐</td>\n",
			
 
				+       "      <td>1</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>116629</th>\n",
			
 
				+       "      <td>仰卧起坐</td>\n",
			
 
				+       "      <td>1</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "  </tbody>\n",
			
 
				+       "</table>\n",
			
 
				+       "<p>116630 rows × 2 columns</p>\n",
			
 
				+       "</div>"
			
 
				+      ],
			
 
				+      "text/plain": [
			
 
				+       "         key    count\n",
			
 
				+       "0         怎么  1051516\n",
			
 
				+       "1          的   123009\n",
			
 
				+       "2        怎么办    93937\n",
			
 
				+       "3        怎么样    91070\n",
			
 
				+       "4          做    63034\n",
			
 
				+       "...      ...      ...\n",
			
 
				+       "116625    做文        1\n",
			
 
				+       "116626   提微商        1\n",
			
 
				+       "116627    仰卧        1\n",
			
 
				+       "116628    起坐        1\n",
			
 
				+       "116629  仰卧起坐        1\n",
			
 
				+       "\n",
			
 
				+       "[116630 rows x 2 columns]"
			
 
				+      ]
			
 
				+     },
			
 
				+     "execution_count": 3,
			
 
				+     "metadata": {},
			
 
				+     "output_type": "execute_result"
			
 
				+    }
			
 
				+   ],
			
 
				+   "source": [
			
 
				+    "df"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 4,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [
			
 
				+    {
			
 
				+     "name": "stdout",
			
 
				+     "output_type": "stream",
			
 
				+     "text": [
			
 
				+      "去重前，停用词数量： 5778\n",
			
 
				+      "去重后，停用词数量： 2462\n"
			
 
				+     ]
			
 
				+    }
			
 
				+   ],
			
 
				+   "source": [
			
 
				+    "# 导入停用词\n",
			
 
				+    "\n",
			
 
				+    "stop_word = [];\n",
			
 
				+    "\n",
			
 
				+    "stop_word_files = os.listdir(STOP_WORD_DIR)\n",
			
 
				+    "for file in stop_word_files:\n",
			
 
				+    "    stop_word_file = os.path.join(STOP_WORD_DIR, file)\n",
			
 
				+    "    with open(stop_word_file) as f:\n",
			
 
				+    "        for item in f:\n",
			
 
				+    "            stop_word.append(item.replace(\"\\n\",\"\"))\n",
			
 
				+    "print(\"去重前，停用词数量：\", len(stop_word))\n",
			
 
				+    "stop_word = list(set(stop_word))\n",
			
 
				+    "print(\"去重后，停用词数量：\", len(stop_word))"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 5,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "# 过滤停用词\n",
			
 
				+    "df = df[df.apply(lambda row : row['key'] not in stop_word, axis=1)]"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 107,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "# 导出过滤后的数据，不要表头和行号\n",
			
 
				+    "df.to_csv(DEST_FILE, header=False, index=False)"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 6,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [
			
 
				+    {
			
 
				+     "data": {
			
 
				+      "text/html": [
			
 
				+       "<div>\n",
			
 
				+       "<style scoped>\n",
			
 
				+       "    .dataframe tbody tr th:only-of-type {\n",
			
 
				+       "        vertical-align: middle;\n",
			
 
				+       "    }\n",
			
 
				+       "\n",
			
 
				+       "    .dataframe tbody tr th {\n",
			
 
				+       "        vertical-align: top;\n",
			
 
				+       "    }\n",
			
 
				+       "\n",
			
 
				+       "    .dataframe thead th {\n",
			
 
				+       "        text-align: right;\n",
			
 
				+       "    }\n",
			
 
				+       "</style>\n",
			
 
				+       "<table border=\"1\" class=\"dataframe\">\n",
			
 
				+       "  <thead>\n",
			
 
				+       "    <tr style=\"text-align: right;\">\n",
			
 
				+       "      <th></th>\n",
			
 
				+       "      <th>count</th>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "  </thead>\n",
			
 
				+       "  <tbody>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>count</th>\n",
			
 
				+       "      <td>115534.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>mean</th>\n",
			
 
				+       "      <td>27.613802</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>std</th>\n",
			
 
				+       "      <td>311.900416</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>min</th>\n",
			
 
				+       "      <td>1.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>25%</th>\n",
			
 
				+       "      <td>1.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>50%</th>\n",
			
 
				+       "      <td>2.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>75%</th>\n",
			
 
				+       "      <td>6.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "    <tr>\n",
			
 
				+       "      <th>max</th>\n",
			
 
				+       "      <td>63034.000000</td>\n",
			
 
				+       "    </tr>\n",
			
 
				+       "  </tbody>\n",
			
 
				+       "</table>\n",
			
 
				+       "</div>"
			
 
				+      ],
			
 
				+      "text/plain": [
			
 
				+       "               count\n",
			
 
				+       "count  115534.000000\n",
			
 
				+       "mean       27.613802\n",
			
 
				+       "std       311.900416\n",
			
 
				+       "min         1.000000\n",
			
 
				+       "25%         1.000000\n",
			
 
				+       "50%         2.000000\n",
			
 
				+       "75%         6.000000\n",
			
 
				+       "max     63034.000000"
			
 
				+      ]
			
 
				+     },
			
 
				+     "execution_count": 6,
			
 
				+     "metadata": {},
			
 
				+     "output_type": "execute_result"
			
 
				+    }
			
 
				+   ],
			
 
				+   "source": [
			
 
				+    "df.describe()"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 7,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [
			
 
				+    {
			
 
				+     "name": "stdout",
			
 
				+     "output_type": "stream",
			
 
				+     "text": [
			
 
				+      "大于1000的数量： 418\n",
			
 
				+      "大于500的数量： 1035\n",
			
 
				+      "大于400的数量： 1340\n",
			
 
				+      "大于300的数量： 1883\n",
			
 
				+      "大于250的数量： 2282\n",
			
 
				+      "大于100的数量： 5104\n"
			
 
				+     ]
			
 
				+    }
			
 
				+   ],
			
 
				+   "source": [
			
 
				+    "print(\"大于1000的数量：\", df[df['count'] > 1000].count().key)\n",
			
 
				+    "print(\"大于500的数量：\", df[df['count'] > 500].count().key)\n",
			
 
				+    "print(\"大于400的数量：\", df[df['count'] > 400].count().key)\n",
			
 
				+    "print(\"大于300的数量：\", df[df['count'] > 300].count().key)\n",
			
 
				+    "print(\"大于250的数量：\", df[df['count'] > 250].count().key)\n",
			
 
				+    "print(\"大于100的数量：\", df[df['count'] > 100].count().key)"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 9,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "# 过滤词频小于300的数据\n",
			
 
				+    "df=df[df['count']>=300]"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 10,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "# 导出过滤后的数据，不要表头和行号，只要关键词列\n",
			
 
				+    "df.to_csv(DEST_FILE_FILTER, header=False)"
			
 
				+   ]
			
 
				+  },
			
 
				+  {
			
 
				+   "cell_type": "code",
			
 
				+   "execution_count": 16,
			
 
				+   "metadata": {},
			
 
				+   "outputs": [],
			
 
				+   "source": [
			
 
				+    "df[5:7].to_csv(\"./data/多线城-3.csv\", header=False)"
			
 
				+   ]
			
 
				+  }
			
 
				+ ],
			
 
				+ "metadata": {
			
 
				+  "interpreter": {
			
 
				+   "hash": "679ecc657d123b537eb7946f00483c298ba68f4074c79757b9e8823d90af42fb"
			
 
				+  },
			
 
				+  "kernelspec": {
			
 
				+   "display_name": "Python 3.9.0 ('jieba')",
			
 
				+   "language": "python",
			
 
				+   "name": "python3"
			
 
				+  },
			
 
				+  "language_info": {
			
 
				+   "codemirror_mode": {
			
 
				+    "name": "ipython",
			
 
				+    "version": 3
			
 
				+   },
			
 
				+   "file_extension": ".py",
			
 
				+   "mimetype": "text/x-python",
			
 
				+   "name": "python",
			
 
				+   "nbconvert_exporter": "python",
			
 
				+   "pygments_lexer": "ipython3",
			
 
				+   "version": "3.9.0"
			
 
				+  },
			
 
				+  "orig_nbformat": 4
			
 
				+ },
			
 
				+ "nbformat": 4,
			
 
				+ "nbformat_minor": 2
			
 
				+}