设为首页收藏本站

简体中文 繁體中文 English 日本語 Deutsch 한국 사람 بالعربية TÜRKÇE português คนไทย french

搜索
热搜: 活动 交友 discuz

Python正文提取算法 [复制链接]
查看:73 | 回复:5

609

主题

4229

回帖

1万

积分

论坛元老

积分
10373
发表于 2011-4-6 22:58:52 | 显示全部楼层 |阅读模式
太阳 就一个

609

主题

4229

回帖

1万

积分

论坛元老

积分
10373
 楼主| 发表于 2011-4-6 23:03:04 | 显示全部楼层
niu

609

主题

4229

回帖

1万

积分

论坛元老

积分
10373
 楼主| 发表于 2011-4-6 23:03:30 | 显示全部楼层
好牛逼

50

主题

4112

回帖

8466

积分

论坛元老

积分
8466
发表于 2011-4-6 23:18:07 | 显示全部楼层
原帖由 xspoco 于 2011-4-6 23:44 发表


好牛逼

28

主题

196

回帖

516

积分

高级会员

积分
516
发表于 2011-4-6 23:24:43 | 显示全部楼层
这语言真累,,,,

141

主题

1675

回帖

3835

积分

论坛元老

积分
3835
发表于 2011-4-6 23:36:28 | 显示全部楼层
[ol]
  •         for div in divs:
  •                 div_html = div.__str__()
  •                 chinese_utf8 = re_chinese.findall(div_html)
  •                 chinese_number = len(chinese_utf8) / 3
  •                 if chinese_number 复制代码这段要改下,迭代里删东西会出问题的



      python 很好...
  • 您需要登录后才可以回帖 登录 | 立即注册

    论坛客服/商务合作/投诉举报:2171544 (QQ)
    落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
    拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
    落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
    © 2001-2014

    浙公网安备 33060302000191号

    浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

      落伍法律顾问: ITlaw-庄毅雄

    Archiver|手机版|Discuz! X

    GMT+8, 2026-6-27 22:18 , Processed in 0.021573 second(s), 3 queries , Gzip On, Redis On.

    返回顶部