Feed Validátor: kontrola produktových dat před exportem

Produktový feed je základ viditelnosti na srovnávačích i marketplace platformách. Každá chyba v datech znamená ztracené zobrazení, chybnou cenu nebo vyřazený produkt. Tento kontrolní nástroj provede váš feed systematickou sadou kontrol, od strukturálních po obsahové. Vychází z praxe, kterou popisujeme v sekci Nástroje a podrobněji v průvodci Produktové feedy. Validace feedu je provozní rutina, ne jednorázový úkon. Čím dříve chybu zachytíte, tím menší škodu napáchá.

Feed validátor na této stránce není plně automatizovaný parser. Je to strukturovaný kontrolní rámec s interaktivním formulářem pro rychlou kontrolu vzorku dat. Umožňuje vložit úryvek feedu a ověřit nejčastější problémové body. Pro kompletní automatizovanou validaci celého feedu doporučujeme tyto kontroly implementovat přímo do vašeho feed management workflow.

Schéma validačního procesu feedu od vstupu po výstupní report
Tok validace: vstupní data, strukturální kontrola, obsahová kontrola, výstupní report

Kdy a proč feed validovat

Většina chyb ve feedech nevzniká při prvním nastavení. Objevují se postupně: při změně sortimentu, aktualizaci e-shopové platformy, přidání nového dodavatele nebo úpravě cenové logiky. Typické situace, kdy je validace nutná:

  • Po přidání nebo odebrání produktových atributů ve zdrojovém systému.
  • Při změně exportního formátu nebo přechodu na novou verzi feedu.
  • Po integraci dat z nového dodavatelského feedu.
  • Když srovnávač nebo marketplace začne hlásit zvýšený počet zamítnutých produktů.
  • Jako součást pravidelné týdenní provozní kontroly.

Validace má dvě úrovně. Strukturální kontrola ověřuje, zda je feed technicky korektní (validní XML, správné kódování, konzistentní oddělovače v CSV). Obsahová kontrola posuzuje kvalitu dat uvnitř: vyplněnost povinných polí, formát cen, dostupnost URL obrázků, délku a kvalitu titulků.

Strukturální kontroly

Strukturální problémy způsobí, že srovnávač feed odmítne celý, nebo ho zpracuje jen částečně. Tyto kontroly by měly proběhnout jako první.

XML feedy:

  • Deklarace kódování v hlavičce odpovídá skutečnému kódování souboru (typicky UTF-8).
  • Dokument je well-formed: správně vnořené elementy, uzavřené tagy, escapované speciální znaky.
  • Kořenový element a struktura odpovídají očekávanému schématu cílové platformy.
  • CDATA sekce jsou správně uzavřené, zejména u popisků obsahujících HTML.

CSV feedy:

  • Oddělovač je konzistentní v celém souboru (čárka, středník nebo tabulátor).
  • Textové hodnoty obsahující oddělovač jsou uzavřeny v uvozovkách.
  • Počet sloupců je stejný na každém řádku.
  • Hlavičkový řádek existuje a názvy sloupců odpovídají dokumentaci cílové platformy.
Přístup k validaci: vrstvy kontrol
Validujte ve třech vrstvách. Nejprve strukturální integrita (je soubor technicky čitelný?). Poté schématická shoda (odpovídá struktura požadavkům platformy?). Nakonec datová kvalita (jsou hodnoty smysluplné?). Přeskočení první vrstvy znehodnotí výsledky dalších dvou. Pokud feed není well-formed XML, nemá smysl kontrolovat obsah polí.

Obsahové kontroly

Obsahová validace posuzuje kvalitu dat v jednotlivých polích. I strukturálně bezchybný feed může obsahovat data, která povedou k zamítnutí produktů nebo ke špatnému zobrazení.

Povinná pole: Každá platforma definuje sadu polí, bez kterých produkt nepřijme. Pro většinu českých srovnávačů jsou to minimálně: identifikátor produktu, název, popis, cena s DPH, URL produktu, URL obrázku a dostupnost. Ověřte, že žádné z těchto polí není prázdné.

Formát cen: Cena musí být číslo bez měnových symbolů, s tečkou nebo čárkou jako desetinným oddělovačem podle požadavku platformy. Nulová cena nebo záporná cena signalizuje chybu v exportní logice.

URL obrázků: URL musí vracet HTTP status 200 a odpovídat obrazovému formátu (JPEG, PNG, WebP). Přesměrování na jinou URL je přijatelné, ale řetězení více přesměrování zpomaluje zpracování a některé platformy ho odmítají.

Délka titulků: Příliš krátký titulek (pod 20 znaků) obvykle neobsahuje dostatek informací. Příliš dlouhý (nad 150 znaků) se na srovnávači ořízne. Optimální délka pro většinu platforem je 40 až 80 znaků.

EAN/GTIN: Pokud je pole přítomné, musí obsahovat platný kód. Neplatný EAN (chybná kontrolní cifra, nesprávný počet číslic) je horší než chybějící EAN, protože může vést ke špatnému párování produktů.

Rychlá kontrola vzorku feedu

Vložte úryvek vašeho feedu (5 až 10 produktů v XML nebo CSV formátu) a vizuálně projděte kontrolní body. Formulář neprovádí automatickou validaci, slouží jako pracovní plocha pro ruční kontrolu se strukturovaným checklistem.

Tabulka nejčastějších chyb ve feedech s frekvencí výskytu a dopadem
Přehled: nejčastější chyby, jak často se vyskytují a jaký mají dopad na viditelnost

Nejčastější chyby a jejich dopad

Na základě praxe se opakují tyto problémy:

Chyba Frekvence Dopad
Chybějící nebo neplatný EAN Velmi častá Snížená viditelnost, špatné párování
Nulová nebo záporná cena Občasná Produkt zamítnut platformou
Nedostupná URL obrázku Častá Produkt bez náhledu, nižší CTR
Chybné kódování diakritiky Občasná Nečitelné titulky a popisy
Kategorie neodpovídá taxonomii Častá Produkt v nesprávné sekci, nižší relevance
Příliš krátký titulek Častá Nedostatek informací pro zákazníka

Další detaily o práci s produktovými daty a jejich validaci najdete v pilíři Produktové feedy a v článku o importu dodavatelských feedů. Pokud řešíte kategorizaci, podívejte se na nástroj Taxonomie produktů.

Doporučený postup pro pravidelnou validaci

  1. Po každém generování feedu spusťte strukturální kontrolu (well-formed XML, konzistentní CSV).
  2. Jednou týdně projděte obsahovou kontrolu na náhodném vzorku 20 až 50 produktů.
  3. Monitorujte počet zamítnutých produktů na straně srovnávače a porovnávejte s předchozím obdobím.
  4. Po každé změně v exportní logice nebo ve zdrojových datech validujte celý feed.
  5. Výsledky validace zaznamenávejte, abyste mohli sledovat trendy a identifikovat opakující se problémy.

Validace feedu je investice do stability provozu. Jednorazová kontrola má hodnotu, ale skutečný přínos přichází s pravidelností. Čím dříve chybu odhalíte, tím méně produktů a příjmů ztratíte.