微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

Analyse der Google AIO (AI Overviews) Quellenangaben: Welche Websites sind beliebter

本文作者:Don jiang

Google AIO (AI Overviews) bevorzugt Websites mit hoher Autorität + hoher Strukturierung + hoher Vertrauenswürdigkeit: Die Daten zeigen, dass bei der Analyse von 36 Millionen AIO-Ergebnissen im Jahr 2025 Wikipedia (11,22 %), YouTube (9,51 %), Google-Offizielle (5,95 %) den höchsten Anteil hatten; die Top 5 Websites (inkl. Reddit, Amazon) erreichten zusammen 38 % der Zitate. Gleichzeitig zeigt die Pew-Studie, dass Wikipedia, YouTube, Reddit 15 % der Quellen ausmachen, und dass .gov-Regierungsseiten einen Anteil von 6 % in AIO haben (bei normaler Suche nur 2 %). Typische Beispiele sind:

  • Wikipedia (Enzyklopädische Autoritätsinhalte)

  • YouTube (Tutorial-/Video-Inhalte)

  • Reddit / Quora (Echte Erfahrungsdiskussionen)

  • Google-Offizieller Blog (blog.google.com)

  • Regierungswebsites (z.B. cdc.gov, nih.gov)

Stärkung der Autor-„Fachkompetenz” (Expertise)

Google AIO bewertet Autoren mit einer quantitativen E-E-A-T-Berechnung von 0-1. Autorenprofile mit überprüfbaren medizinischen (MD) oder juristischen (JD) Qualifikationen haben eine um 45 % höhere AI-Zitierungsrate. Schema.org Person-Markups mit Attributen wie alumniOf und jobTitle senken die Ablehnungsrate der AI-Informationsgewinnung um 30 %. Bei YMYL-Suchbegriffen (Your Money or Your Life) machen Inhalte mit vollständig im Google Knowledge Graph erfassten Autoren-Entities 72 % der AIO-Zitatquellen aus.

Strukturierte Daten

Stellen Sie sich vor, dass der Google AI wie ein Super-HR-Manager ist, der jeden Tag Dutzende Millionen von Lebensläufen sichten muss. Wenn Sie nur in einer Ecke der Webseite schreiben „Der Autor dieses Artikels ist ein erfahrener Mediziner mit zehn Jahren Erfahrung”, muss die AI das gesamte Netz durchsuchen, um dies zu überprüfen – sie wird Sie wahrscheinlich ignorieren.

Strukturierte Daten (Schema-Code) sind wie eine standardisierte „digitale Visitenkarte”, die Sie der AI proaktiv überreichen. Dieser Code befindet sich im Backend der Webseite, für normale Leser unsichtbar, aber die AI kann ihn in einer Sekunde lesen. Wenn Sie den Lebenslauf des Autors detailliert in die AI eingeben, ist sie natürlich eher bereit, Ihren Artikel zu zitieren.

Das Parsing-Zeitlimit, das Google Search-Bots für standardmäßige HTML-Webseiten zuweisen, beträgt konstant 15 Millisekunden. Durch das Einbinden eines vollständigen JSON-LD-Codepaket im <head>-Bereich der Webseite benötigt der Crawler nur 0,4 Millisekunden, um Skripte mit @type: Person-Markierungen zu extrahieren. Die New York Times spart dadurch täglich bis zu 42 % des Server-Crawl-Budgets, indem sie diese 14,6 Millisekunden Differenz nutzt.

Reintextseiten sind stark auf Natural Language Processing-Technologie angewiesen. Durch das Binden der knowsAbout-Eigenschaft an Wikipedia-URLs für Fachbegriffe erhält ein Technologiekolumnist in seinem Code die Cloud Computing-Wiki-URL und erzielt einen semantischen Matching-Score von 0,85. Seiten ohne diesen Code verbrauchen dreifache Rechenressourcen, um die Fachkompetenz des Autors zu erraten.

Das sameAs-Array weist Maschinen an, echte Lebensläufe in verschiedenen öffentlichen Datenbanken abzugleichen. Die Eingabe einer 16-stelligen ORCID iD-URL bestätigt die akademischen Publikationsaufzeichnungen des Autors der letzten 10 Jahre. Nach dem Binden einer aktiven LinkedIn-URL sank die Identitätsambiguitätsfehlerrate in der Knowledge Graph API-Berechnung um 62 %.

  • jobTitle als Chief Financial Officer ausgefüllt – Matching-Rate 94 %
  • worksFor verschachtelt mit @id bindet die Bloomberg L.P.-Entität
  • alumniOf verknüpft mit der Stanford University-Alumni-Datenbank
  • honorificPrefix festgelegt als Dr. oder Prof.

Medizinische Q&A-Websites setzen häufig das hasCredential-Attribut ein. Autoren der Mayo Clinic füllen in das Feld EducationalOccupationalCredential eine 8-stellige MD-Ärztenummer ein. Der AIO-Algorithmus extrahiert diese Zahlen, um sie mit der American Medical Association-Registrierungsdatenbank abzugleichen.

Webseiten mit Einzelautorschaft tragen ein um 12 % höheres Risiko für faktische Fehlerkorrekturen. Die Konfiguration des reviewedBy-Markups führt ein zweites maschinelles Verifizierungsverfahren ein. Ein medizinischer Artikel, der von einem zweiten zugelassenen Facharzt überprüft wurde, erhielt eine 1,4-fache Verbesserung der Anzeigehäufigkeit im AIO-Panel.

Literaturverzeichnisse werden durch das citation-Attribut vollständig in die JSON-LD-Struktur integriert. Code mit mehr als 5 Links zu DOI-Identifikatoren des Lancet-Magazins baut einen Graphen mit hoher Glaubwürdigkeit auf. Basierend darauf vergibt der Crawler einen anfänglichen Vertrauenswert von 91 Punkten für die Webseite.

  • identifier mit der Anwaltszulassungsnummer der New York State Bar Association
  • knowsLanguage标注 EN-US oder EN-GB Sprachsystem
  • publishingPrinciples verlinkt auf 2.000 Wörter vollständige englische Redaktionsrichtlinien
  • memberOf bestätigt die American Bar Association-Mitgliedschaft

Datendiskrepanzen zwischen frontend-visualisiertem Text und Backend-JSON-LD-Code lösen manuelle Bestrafungsmechanismen aus. Wenn die Autorenbeschreibung und das description-Feld im Code eine Zeichenabweichung von mehr als 5 % aufweisen, sinkt die Seitenindexierungsrate drastisch. Google Search Console sendet innerhalb von 24 Stunden 3 rote Warn-E-Mails über nicht parsbare strukturierte Daten.

Das mainEntityOfPage-Attribut fixiert das Autorenprofil an einer bestimmten /author/john-doe-URL. Diese URL-Struktur bleibt während des gesamten 10-jährigen Veröffentlichungsplans zu 100 % konsistent. Das willkürliche Umleiten von Autorenprofil-URLs führt dazu, dass die angesammelten E-E-A-T-Scores in den ersten 7 Tagen um 88 % verloren gehen.

Extrem schnell ladender statischer Autorencode half The Washington Post, die tägliche Crawl-Quote zu erhöhen. Client-seitig gerenderte JavaScript-Autorseiten verbrauchen bei jeder V8-Engine-Rendering-Warteschlange 400 Megabyte Speicher. Server-seitig gerenderte reine JSON-LD-Codeblöcke eliminieren den Speicheroverhead vollständig.

Das image-Attribut erfordert zwingend ein hochauflösendes Profilbild mit EXIF-Informationen. Die Größe ist streng auf 1200×800 Pixel begrenzt, und das Volumen muss unter 50 Kilobyte komprimiert werden. In 43 % der Desktop-Geräte-Suchantworten zeigt die AIO-Oberfläche das mit diesem Markup versehene Profilbild links neben dem generierten Textausschnitt.

Social-Media-Interaktionsdaten werden durch die InteractionStats-Syntax in den Code integriert. Ein Tech-Blogger mit 50.000 X-Plattform-Followern übermittelt die Follower-Zahl kontinuierlich an den Crawler über den UserInteraction-Typ. Der Algorithmus liest diesen Wert alle 48 Stunden, um den Online-Einflussradius des Autors zu berechnen.

  • interactionType zeichnet über 500 namentliche Nutzerkommentare auf
  • datePublished präzisiert den Erstveröffentlichungszeitpunkt auf Sekundenebene gemäß ISO 8601
  • dateModified erfasst den Zeitstempel der letzten Überarbeitung
  • publisher bindet die 9-stellige Bundessteuer-Identifikationsnummer der Muttergesellschaft

B2B-Bewertungswebsites wie Capterra nutzen intensiv den ratingValue-Code für ihre Autoren. Ein Autor, der 150 SaaS-Anwendungen aus erster Hand getestet hat, erhielt ein persistentes Experten-Entity-Tag in der Knowledge Vault-Datenbank. Das System umgeht in 68 % der Suchvorgänge die offiziellen Herstellerseiten und extrahiert die Praxistestdaten dieses Autors.

Das globale Schema.org-Vokabular folgt strikt einem 6-Monats-Release-Zyklus für Hauptversionen. Nach dem Sprung von Version 13.0 auf 15.0 wurden neue Felder speziell für generativen Text hinzugefügt. Die explizite Erklärung von 0 % maschinell generiertem Inhalt im usageInfo-Attribut führt zu einer um 15 % längeren Verweildauer an der黄金引用位置 (obersten Anzeigeposition).

滚动至顶部