Andere Arten

So funktioniert unser Website-Crawler

Ein Website-Crawler-Tool, das alle Ihre Inhalte aufspürt, unabhängig davon, wo sie gespeichert sind.

Bieten Sie Ihren Nutzern eine hervorragende Website-Suche

Sind die Inhalte Ihrer Website in separaten Systemen isoliert und werden von verschiedenen Teams verwaltet? Der erste Schritt zur Bereitstellung einer hochwertigen Website-Suche ist die Implementierung eines erstklassigen Crawling-Prozesses.

Unser Web-Spider kann Ihrem Unternehmen Zeit sparen und Ihre Kosten senken, da Sie keine Datenpipelines zwischen Ihren einzelnen Content-Repositorys und Ihrer Website-Suchsoftware aufbauen müssen und auch das damit verbundene Projektmanagement entfällt.

Verwandeln Sie Ihre Website in strukturierte Inhalte

Sie können unserem Website-Crawler genau mitteilen, wie er vorgehen soll, damit er Ihre Inhalte korrekt interpretiert. So können Sie beispielsweise sicherstellen, dass Nutzer neben Standard-Webseiten auch nach Nachrichtenartikeln, Stellenanzeigen und Finanzberichten suchen und darin navigieren können, einschließlich Informationen in Dokumenten, PDFs, HTML und JavaScript.

Sie müssen keine Meta-Tags hinzufügen.

Sie können Ihre Inhalte extrahieren lassen, ohne zuvor Meta-Tags zu Ihrer Website hinzuzufügen. Unser Webcrawler ist nicht auf benutzerdefinierte Metadaten angewiesen. Stattdessen stellt er Ihrem technischen Team einen benutzerfreundlichen Editor zur Verfügung, mit dem Sie festlegen können, welche Inhalte Sie extrahieren möchten und wie diese strukturiert werden sollen.

Bereichern Sie Ihre Inhalte, um sie relevanter zu machen.

Um die Relevanz der Suchergebnisse für Ihre Nutzer zu verbessern, können Sie Ihre extrahierten Inhalte mit Geschäftswebdaten anreichern, darunter Daten aus Google Analytics und Adobe Analytics. Mit Algolia Crawler können Sie Daten zum Besucherverhalten und zur Seitenleistung nutzen, um Ihre Suchmaschinenrankings anzupassen, Ihren Inhalten Kategorien zuzuweisen, um die Navigation zu verbessern, und vieles mehr.

Konfigurieren Sie Ihr Crawling nach Bedarf.

Automatische Crawling-Sitzungen planen

Sie können unser Website-Crawler-Tool so konfigurieren, dass es Ihre Webdaten nach einem festgelegten Echtzeit-Zeitplan überprüft, beispielsweise jeden Abend um 21 Uhr, mit einem erneuten Crawling am nächsten Tag um 12 Uhr mittags.

Crawl manuell einrichten

Bei Bedarf können Sie das Crawling eines bestimmten Bereichs Ihrer Website oder sogar der gesamten Website manuell auslösen.

Sag ihm, wo er hingehen soll

Sie können festlegen, welche Teile Ihrer Website oder welche Webseiten von unserem Web-Spider gecrawlt (oder vermieden) werden sollen, oder Sie können ihn automatisch überall crawlen lassen.

Erlaubnis erteilen

Konfigurieren Sie unseren Crawler so, dass er passwortgeschützte Seiten erkundet und indexiert.

Halten Sie Ihre durchsuchbaren Inhalte auf dem neuesten Stand

URL-Inspektor

Auf der Registerkarte „Inspektor“ können Sie alle gecrawlten URLs anzeigen und überprüfen und dabei feststellen, ob jedes Crawling erfolgreich war, wann es abgeschlossen wurde und welche Datensätze generiert wurden.

Überwachung

Auf der Registerkarte „Überwachung“ können Sie die Details zum letzten Crawling anzeigen und Ihre gecrawlten URLs nach Status sortieren (erfolgreich, ignoriert, fehlgeschlagen).

Datenanalyse

Auf der Registerkarte „Datenanalyse“ können Sie die Qualität des von Ihrem Web-Crawler erstellten Index bewerten und überprüfen, ob bei einigen Datensätzen Attribute fehlen.

Pfad-Explorer

Auf der Registerkarte „Pfad-Explorer“ können Sie sehen, welche Pfade der Crawler untersucht hat, wie viele URLs jeweils gecrawlt wurden, wie viele Datensätze extrahiert wurden und wie viele Fehler während des Crawling-Prozesses aufgetreten sind.

Die fortschrittlichsten Unternehmen experimentieren täglich mit dem Crawler.

„Wir haben erkannt, dass die Suche eine Kernkompetenz des Unternehmens LegalZoom sein sollte, und wir betrachten Algolia als ein umsatzgenerierendes Produkt.“
 

Mrinal Murari

Teamleiter Tools & Senior Software Engineer bei LegalZoom

Empfohlene Inhalte

Was ist ein Webcrawler?

Was ist ein Webcrawler?

Ein Webcrawler ist ein Bot – ein Softwareprogramm –, der systematisch eine oder mehrere Websites besucht und die dort gefundenen Daten katalogisiert.

30 Tage, um die Leistung unseres Crawlers um 50 % zu verbessern

30 Tage, um die Leistung unseres Crawlers um 50 % zu verbessern

Dieser Artikel beschreibt, wie wir die Interna unseres App-Crawlers überarbeitet, nach Engpässen gesucht und Aufgaben optimiert haben, um die Verarbeitung dieser komplexen parallelen und verteilten Software zu optimieren.

Algolia-Crawler

Algolia-Crawler

Ein Überblick darüber, was der Algolia Crawler für Ihre Website leisten kann.

Website-Crawler FAQ

Entwickeln Sie beeindruckende Suchfunktionen.