Jsoup - Получить значок со страницы HTML

Jsoup - Получить значок со страницы HTML

favicons_collection1

Веб-браузер может распознать фавикон по-разному:

Пример 1

  
    
  

Пример 2

  
    
  

Пример 3 - странный, но Google использует это.

  
    
  

1. Пример Jsoup

Отрывки кода, чтобы получить выше favicon с Jsoup.

    Element element = doc.head().select("link[href~=.*\\.(ico|png)]").first();
    System.out.println(element.attr("href"));
    Element element = doc.head().select("meta[itemprop=image]").first();
    System.out.println(element.attr("content"));

2. Модульный тест

Пример юнит-теста.

package com.webmitta.analysis;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.testng.Assert;
import org.testng.annotations.Test;

@Test
public class TestFavIcon {

  Document document;

  private String PageProvider1() {

    StringBuffer html = new StringBuffer();

    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("something");
    html.append("");
    html.append("");

    return html.toString();

  }

  private String PageProvider2() {

    StringBuffer html = new StringBuffer();

    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("");
    html.append("something");
    html.append("");
    html.append("");

    return html.toString();
  }

  @Test
  void test_FavIcon1() {

    Document doc = Jsoup.parse(PageProvider1());

    Element element = doc.head().select("link[href~=.*\\.(ico|png)]").first();
    Assert.assertEquals(element.attr("href"),
        "http://example.com/image.ico");

  }

  @Test
  void test_FavIcon2() {

    Document doc = Jsoup.parse(PageProvider2());

    Element element = doc.head().select("meta[itemprop=image]").first();
    Assert.assertEquals(element.attr("content"),
        "/images/google_favicon_128.png");

  }

}

Выход

[TestNG] Running:
  C:\Users\example2002\AppData\Local\Temp\testng-eclipse--1846902117\testng-customsuite.xml

PASSED: test_FavIcon1
PASSED: test_FavIcon2