【发布时间】:2017-03-19 11:15:12
【问题描述】:
我正在为词云准备文本,但我卡住了。
我需要删除所有数字,所有符号,如 . , - ? = / ! @ 等,但我不知道如何。我不想一次又一次地更换。有办法吗?
这是我的概念和我必须做的:
- 在一个字符串中连接文本
- 将字符设置为小写
- 现在我想删除特定的标志并将文本分成单词(列表)
- 计算单词的频率
- 接下来执行停用词脚本...
abstracts_list = open('new','r')
abstracts = []
allab = ''
for ab in abstracts_list:
abstracts.append(ab)
for ab in abstracts:
allab += ab
Lower = allab.lower()
文字示例:
MicroRNAs (miRNAs) 是一类非编码 RNA 分子 大约 19 到 25 个核苷酸长,可下调 靶基因在转录后水平的表达 与 3'-非翻译区 (3'-UTR) 结合。爱泼斯坦-巴尔病毒 (EBV) 产生至少 44 个 miRNA,但其中大多数的功能 miRNA尚未被鉴定。之前,我们将 BRUCE 报告为 miR-BART15-3p 的靶标,EBV 产生的 miRNA,但我们的数据 提示可能存在其他与凋亡相关的靶基因 miR-BART15-3p。因此,在本研究中,我们寻找新的目标 使用计算机分析的 miR-BART15-3p 基因。我们找到了一种可能 Tax1 结合蛋白 1 (TAX1BP1) 的 3'-UTR 中的种子匹配位点。这 报告载体的荧光素酶活性,包括 3'-UTR TAX1BP1 被 miR-BART15-3p 降低。 MiR-BART15-3p 下调 TAX1BP1 mRNA 和蛋白在 AGS 细胞中的表达,而 miR-BART15-3p抑制剂上调TAX1BP1的表达 AGS-EBV 细胞中的 mRNA 和蛋白质。 Mir-BART15-3p 调制的 NF-κB 在胃癌细胞系中的活性。此外,miR-BART15-3p 强烈促进对 5-氟尿嘧啶 (5-FU) 的化学敏感性。我们的 结果表明 miR-BART15-3p 靶向抗凋亡 TAX1BP1 癌细胞中的基因,导致细胞凋亡和化学敏感性增加 到 5-FU。
【问题讨论】:
-
那么你的代码在哪里,它到底有什么问题?这既不是代码编写也不是教程服务。
-
请展示您到目前为止所尝试的内容。
-
感谢编辑,我在编辑代码时遇到了问题;/
标签: python text word-cloud