雷达智富

首页 > 内容 > 程序笔记 > 正文

程序笔记

C#正则表达式获取所有图片src

2024-07-21 56

在C#中可以使用正则表达式获取HTML中所有图片的src属性。以下是一个简单的示例:

using System;
using System.Text.RegularExpressions;

class Program
{
    static void Main()
    {
        string htmlContent = "<html><body><img src=\"image1.jpg\"><img src=\"image2.jpg\"></body></html>";

        // 匹配所有图片的src属性
        string pattern = @"<img.*?src=\""(.*?)\"".*?>";
        MatchCollection matches = Regex.Matches(htmlContent, pattern);

        // 提取每个匹配项中的src属性值
        foreach (Match match in matches)
        {
            string src = match.Groups[1].Value;
            Console.WriteLine(src);
        }
    }
}

这个示例中,我们使用了一个简单的正则表达式模式来匹配<img>标签,并提取其src属性值。这里的正则表达式模式是<img.*?src=\""(.*?)\"".*?>,它的含义是:

<img.*?>:匹配<img>标签及其属性,.*?表示匹配任意数量的字符,但尽可能少地匹配,以避免贪婪匹配。

src=\""(.*?)\"":匹配src属性及其值,(.*?)表示匹配任意数量的字符,但尽可能少地匹配,并将其作为一个捕获组以便后续提取。

.*?>:匹配>符号以结束<img>标签。

在循环中,我们通过match.Groups[1].Value提取了每个匹配项中捕获组1的值,即src属性的值,并将其打印输出。

更新于:4个月前
赞一波!

文章评论

评论问答