Adatvezérelt termékajánlási rendszer implementálása tortakellék webáruházban
Helyzet: új webáruház, cross-sale lehetőségek
Partnerünk egy tortakellék specializált webáruház volt, amely éppen lecserélte régi webshopját egy modern platformra. A tulajdonos felismerte, hogy az új rendszerrel lehetőség nyílik termékajánlási funkció bevezetésére a bevételek növelése érdekében.
Rendelkezésre álltak részletes értékesítési adatok: 118.000+ tranzakciós tétel, 2.229 különböző termék és 6.157 vásárlás egy évről. Az adatok tartalmázták a vásárlások összetételét termék- és kategóriaszinten, ami ideális alapot nyújtott egy fejlett ajánlási algoritmus kiépítéséhez.
A tortakellékek piaca különleges abból a szempontból, hogy a vásárlók általában "projekthez" vásárolnak - egy torta elkészítéséhez több kiegészítő kellék szükséges. Ez pedig azt jelentette, hogy az adatokban valószínűleg erős termékkapcsolatok rejlenek, amelyeket érdemes feltárni.
A webfejlesztő azonban megkérdőjelezte a projekt értelmét: "Felesleges bonyolítani, elég kategóriák alapján ajánlásokat tenni. Tortagyertya mellé tortacsillagszóró, ez logikus és egyszerű." Ez vezetett a kulcskérdéshez: érdemes-e adatalapú megközelítést alkalmazni, vagy elég az egyszerű kategória-logika?
Kihívás: technikai és metodológiai akadályok
Az elemzés során több kritikus kihívással szembesültünk, amelyek mind megoldásra szorultak:
Adatminőségi problémák: A 118.000 soros adathalmazban 797 terméknek hiányzott a kategória információja (N/A értékek). Emellett duplikált cikkszámok fordultak elő különböző kategóriákban, ami inkonzisztenciát okozott a termék-kategória párosításban.
Algoritmus paraméterhangolás: Az asszociációs bányászat rendkívül érzékeny a min_support paraméter beállítására. 0.02-nél csak 113 termék kapott ajánlatot, 0.01-nél pedig 117GB memóriaigény miatt elszállt a rendszer.
Kategória vs. termékszint dilemmája: A két megközelítés összehasonlításához hibrid elemzési rendszert kellett kiépíteni, amely párhuzamosan futtatja mind a kategória-, mind a termékszintű algoritmusokat.
Teljesítményoptimalizálás: A nagy adatmennyiség miatt (6.157 tranzakció, 2.229 releváns termék) komoly optimalizálást igényelt az algoritmus, különösen a memóriahasználat terén.
Ezek a technikai kihívások mellett az volt a legnagyobb dilemma, hogy melyik megközelítés ad valóban értékes üzleti eredményt.
Megoldás: hibrid algoritmus és intelligens adattisztítás
A problémák megoldására többlépcsős megközelítést alkalmaztunk, amely mind a technikai, mind az üzleti kihívásokat kezelte:
Adattisztítás és -konszolidáció: A hiányzó kategóriákat "N/A" értékkel töltöttük fel törlés helyett, így megőriztük az értékes termékkapcsolatokat. A duplikált cikkszámokat groupby() módszerrel konszolidáltuk, minden termékhez az első előfordulást használva.
Finomhangolt paraméterezés: Szisztematikus teszteléssel megtaláltuk az optimális beállításokat: min_support=0.003, min_confidence=0.15-0.2, min_lift=1.5-2.0. Ez lehetővé tette, hogy a memóriaigény kezelhető maradjon, miközben jelentős számú terméket tudjunk elemezni. Az érdekesség kedvéért: a túl alacsony beállítások mellett az algoritmus több mint 2 millió lehetséges termékkapcsolatot próbált meg egyszerre elemezni!
Adatvolumen kezelése: A 118.000 tranzakciós tétel, 6.157 egyedi vásárlás és 2.229 termék feldolgozása komoly számítási kihívást jelentett. A memóriaoptimalizálás érdekében úgy kellett beállítani az algoritmusokat, hogy csak a ténylegesen releváns kapcsolatokat vizsgálják meg, elkerülve a kombinatorikus robbanást.
Termékösszevonások:Kihívást jelentett az összetartozó, vagyis összevont termékek kezelése is. A szülő-gyermek kapcsolatok elemzése, szűrése és kizárása az ajánlási rendszerből alapvető előfeltétele a sikeres cross-sale ajánlásnak.
Hibrid elemzési rendszer: Párhuzamosan futtattuk a termék- és kategóriaszintű algoritmusokat. A termékszinten az mlxtend könyvtár Apriori algoritmusát használtuk, míg kategóriaszinten egyszerűsített szabályokkal dolgoztunk.
Mélységi validáció: Nem csak az első ajánlatokat elemeztük, hanem az 5. és 10. pozíciót is, hogy megbizonyosodjunk az algoritmus konzisztenciájáról és a találatok minőségéről.
Interaktív kimenet: Az eredményeket Excel formátumban strukturáltuk szűrési lehetőségekkel, hogy az ügyfél könnyen elvégezhesse a döntéstámogató elemzéseket.
Eredmény: döntő bizonyítékok a termékszintű megközelítés mellett
Az elemzés egyértelmű eredményeket hozott, amelyek alátámasztották az adatvezérelt megközelítés értékét:
Termékszintű ajánlások teljesítménye:
983 termék kapott abszolút értékelhető ajánlatot (15% megveszi, 2x nagyobb eséllyel mint a véletlen544 termék kapott biztos ajánlatokat (24% lefedettség a 2,229 termékből)
544 biztos ajánlat (vásárlók 20%-a tényleg megveszi, 3x nagyobb eséllyel mint véletlenszerűen)
182 termék rendelkezik 10+ szuper ajánlattal (30% megveszi, 5x nagyobb eséllyel mint a véletlen
Konzisztens minőség sokszor a 10. ajánlaton túl is
Kategóriaszintű ajánlások teljesítménye:
91 releváns szabály 23 kategória között
Maximum 2,4x nagyobb vásárlási esély mint véletlenszerű ajánlás
Logikus, de kiszámítható kapcsolatok (tortagyertya → tortacsillagszóró)
Limitált meglepetés-faktor - kevés váratlan kapcsolat
Döntő különbség: A termékszintű algoritmus kiemelkedően erősebb vásárlói kapcsolatokat talált, mint a kategória-alapú megközelítés. Egyes konkrét termékpárok esetében meglepően nagy az esélye annak, hogy a vásárló megveszi az ajánlott terméket, míg kategóriaszinten ez maximum valószínű volt.
Mit jelentenek ezek a számok a gyakorlatban? Ha egy vásárló tortagyertyát tesz a kosárba, akkor egy jól kiválasztott specifikus tortacsillagszórót akár százszor nagyobb eséllyel fog megvenni, mint ha véletlenszerűen ajánlanánk neki bármilyen terméket. Ez hatalmas különbség a konverzió szempontjából.
Gyakorlati implementálhatóság: Az 898 biztos ajánlat közvetlenül implementálható a webshopban, azonnal mérhető konverziónövekedést eredményezve.
Tanulság: az adatok felülírják az intuíciót
Ez a projekt kiváló példája annak, hogy miért érdemes adatvezérelt döntéseket hozni az intuíció helyett, még akkor is, ha az utóbbi logikusnak tűnik:
A "logikus" nem mindig az optimális: Míg a kategória-alapú ajánlások valóban logikusnak tűntek (tortagyertya → tortacsillagszóró), az adatok sokkal specifikusabb és erősebb kapcsolatokat tártak fel konkrét termékpárok között.
Technikai kihívások megtérülnek: Bár az adattisztítás és algoritmus-hangolás jelentős munkát igényelt, a végeredmény 10-szeres teljesítménynövekedést hozott a simple kategória-megközelítéshez képest.
Hibrid megközelítés értéke: A párhuzamos elemzés lehetővé tette, hogy objektív összehasonlítást végezzünk és számszerűsítsük a különbségeket.
Skálázhatóság: Az 57%-os termékfedettség azt jelenti, hogy a webáruház termékeinek több mint felénél lehet személyre szabott ajánlásokat tenni, jelentős bevétel-potenciállal.
Algoritmus komplexitása vs. eredmény: Míg a kategória-alapú megközelítés néhány egyszerű szabállyal megoldható lett volna, az adatalapú algoritmus több millió lehetséges kombinációt vizsgált meg. Ez a technikai komplexitás azonban megtérült: a végeredmény 2-5-szörös teljesítménynövekedést hozott.
Piaci előny: A legtöbb kisebb e-commerce oldal még mindig egyszerű "mások is vették" vagy kategória-alapú ajánlásokat használ. A fejlett asszociációs szabály-algoritmusokkal jelentős versenyelőnyt lehet szerezni, különösen egy olyan specializált piacon, mint a tortakellékek.
ROI tervezhetőség: A konkrét számok (898 implementálható ajánlat, sokszoros kapcsolaterősség) lehetővé teszik a várható konverziónövekedés becslését és az algoritmus ROI-jának kalkulálását.
Projektmódszertan: A fokozatos paraméterhangolás és a mélységi validáció biztosította, hogy ne csak a felszínes eredményeket nézzük, hanem az algoritmus valódi teljesítményét is megértsük.
Szeretné kihasználni webáruháza cross-sale lehetőségeit?
Ha Önnél is van értékesítési adat és szeretné tudni, hogy kategória- vagy termékszintű ajánlások működnének jobban, elemezzük ki együtt! Gyakran a már meglévő tranzakciós adatok alapján jelentős konverziónövekedést lehet elérni.
Kérjen ingyenes konzultációs időpontot További esettanulmányok