查无此鸟的博客 一个不误正业的交通工程师的个人网站

删除HTML标签并统计字数(VB.NET源代码)

标签:野生程序猿 | 发表时间:2020-10-13 21:23:56 | 更新时间: 2020-11-26 13:46:22 | 阅读数:380 | 评论数:0 | 字数:648

本站每篇博客均有一个“字数”的数据信息。这个数据最开始是通过手工统计的——说起来不怕笑话——是将博客内容复制到ms word里面,再用word的字数统计功能统计出字数,再填写到博客的字数信息里。虽然操作起来也不算麻烦,几秒钟就能搞定。但是一来显得太低端,二来若对博客进行编辑,上述操作需要重复进行。若编辑的次数多,就显出效率低下了。 一直想要实现字数自动统计的功能,今天终于腾出手来实现了,下面是统计HTML中字符数的函数 Public Function GetHtmlWordsCount(HtmlString As String) As Integer Dim regex As Regex = New Regex("<(.|\n)+?>") '去除空格 HtmlString = Replace(HtmlString, " ", "") '去除回车 HtmlString = Replace(HtmlString, vbCrLf, "") HtmlString = Replace(HtmlString, Chr(10), "") HtmlString = Replace(HtmlString, Chr(13), "") '去除HTML标签 HtmlString = regex.Replace(HtmlString, "") '返回字符数 Return Len(HtmlString) End Function 需要说明的是,上面这个函数得到的是字符数,而非字数。区别在于前者将诸如“abcdefg”计作7个字符,而后者记为1个字,如下图所示。因为这个差别,本站的字数统计由39万增加到了53万。呵呵呵~

版权声明:本文由@查无此鸟创作,采用知识共享 署名-非商业性使用-禁止演绎 3.0 中国大陆许可协议进行许可。除非注明,均为原创文章,请在转载时注明来源,并完整保留本段声明。本文地址: http://liyonggang.net/blog.aspx?id= 2020-10-13



本文评论:
暂无评论……

发表评论:(昵称或评论内容不允许为空!邮箱可不填,但建议填写以备联系,邮箱将不显示在评论中。) 昵称 邮箱

查无此鸟的博客

Copyright©查无此鸟 2020~2022, All Rights Reserved

邮箱:t5lyg@126.com

其他链接

卢昌海的网站 | 鱼の后花园博客) | 新交通人的技术闲谈-知乎 | FROYOs Blog | 博客园 | 鸟哥Linux | 蜂鸟的小窝 | 大眼仔

AutoCAD.NET: Kevin K | 大非sb