5
A
回答
1
正则表达式将是我的方式。 ;)
0
搜索字符串,你会想查找正则表达式。至于标记它,一旦你有子字符串的位置,它应该足够简单,使用它来添加一些东西来包装短语。
1
如果您使用符合XHTML的HTML,则可以将其作为XML文档加载,然后使用XPath/XSL--长长的蜿蜒但优雅?
我过去使用的方法是使用HTMLTidy将杂乱的HTML转换为XHTML,然后使用XSL/XPath将屏幕内容转换为数据库,以创建反向内容管理系统。
正则表达式可以做到这一点,但是如果尝试剥离标签,图像名称等以消除误报,可能会很复杂。
1
在简单的情况下,正则表达式会做。
string input =“ttttttgottttttt”;
string output = Regex.Replace(input,“go”,“<strong> $ 0 </strong >”);
将产生:“TTTTTT < STRONG>去< /强> TTTTTTT”
但是,当你说HTML,如果你指的是渲染的最后文本,这是一个有点乱。假设你已经有了这个HTML:
<跨度类= “firstLetter” >乙</SPAN > OOK
为了突出这个词 '书',你会需要一个适当的HTML渲染器的帮助。为了简化起见,可以先删除所有标签,只留下内容,然后进行通常的替换,但是它感觉不正确。
1
你可以看看使用Html DOM,SourceForge.net上的一个开源项目。 通过这种方式,您可以以编程方式操作文本而不是依赖正则表达式。
7
我喜欢使用Html Agility Pack非常容易使用,虽然最近没有太多更新,但它仍然可用。例如抓取所有链接
HtmlWeb client = new HtmlWeb();
HtmlDocument doc = client.Load("http://yoururl.com");
HtmlNodeCollection Nodes = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (var link in Nodes)
{
Console.WriteLine(link.Attributes["href"].Value);
}
相关问题
- 1. 从文本文件中获取字符串并从文本文件中搜索并替换另一个字符串的最佳方法是什么?
- 2. 在字符串中找到特定标记的最佳方法是什么?
- 3. c#搜索特定字符串的文本文件并获取文件路径
- 4. 在文本文件中搜索字符串的更快方法
- 5. 从文件中提取版本字符串的最佳方法是什么?
- 6. 标记搜索结果的最佳方法是什么?
- 7. 什么是标记任何文本的最佳方式?
- 8. 从URL字符串去除脚本标记的最佳方式是什么?
- 9. 索引唯一文本字段的最佳做法是什么?
- 10. 如何搜索包含特定文本字符串的文件?
- 11. 什么是定义标签和文本框的最佳方式
- 12. 什么是最佳搜索方法?
- 13. Android中很长的文本或字符串的最佳方式是什么?
- 14. 文本搜索的最佳算法
- 15. 什么是从字符串中检索特定部分文本的最有效方法
- 16. 在Objective-C中搜索字符串的最快方法是什么?
- 17. 搜索文本文件的字符串
- 18. 在字符串(PowerShell)中转义HTML特定字符的最佳方法是什么?
- 19. 替换字符串中文本的最佳方法
- 20. 在SQL中实现子字符串搜索的最佳方式是什么?
- 21. 删除部分字符串的最佳方法是什么? (C#)
- 22. 在C/C++中加密文本文件的最佳方式是什么?
- 23. 什么是最好的方法来搜索正文的HTML一些文字
- 24. 在Eclipse中搜索字符串实例的最佳方法
- 25. PHP在数组中搜索字符串值的最佳方法?
- 26. 文本文件解析 - 如何搜索特定字符串并返回整行?
- 27. Kibana:文本中搜索字符串
- 28. 使用shell编辑文本文件记录的最佳方法是什么?
- 29. 在文件中搜索字符串的最快方法
- 30. 在用户控件中更改标签文本的最佳方法是什么?
它处于alpha状态,2005年最后一次更新,意味着不再维护。 – 2009-02-07 17:38:58