Construindo um rastreador web - usando pacotes Webkit

votos
4

Eu estou tentando construir um web crawler.
Preciso 2 coisas:

  • Converter o HTML em um objeto DOM.
  • Executar JavaScripts existentes sob demanda.
O resultado que eu espero é um objeto DOM, onde o JavaScript que executa em carga já é executado.
Além disso, eu preciso de uma opção para executar sob demanda JavaScripts adicionais (em eventos como: onMouseOver, onMouseClicketc.) Primeiro de tudo, eu não poderia encontrar uma boa fonte de documentação.
Eu procurei através Webkit Página Principal mas não conseguiu encontrar muita informação para os usuários do pacote, e há exemplos de código útil. Instruções também, em alguns fóruns que eu vi para não usar a interface do Webkit para crawlers, mas diretamente o DOM e Javascript embalagens interiores.

Estou à procura de documentação e exemplos de código .
Além disso, quaisquer recomendações sobre uso adequado.

Ambiente de trabalho:
  • SO: Windows
  • Lang: C ++

Publicado 02/10/2008 em 12:12
fonte usuário
Em outras línguas...                            


1 respostas

votos
1

Confira algumas das ferramentas de teste embalados juntamente com o tronco WebKit. A maioria dos portos (tanto quanto eu sei) incluem DumpRenderTree que instancia um WebKitView e depois cospe uma árvore prestar após o processamento de um arquivo especificado. É teoricamente um dos exemplos mais simples de WebKit possível.

Respondeu 22/12/2008 em 18:01
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more