fbpx

AIgnite Your Reach

  +48 22 487 83 01  ul. Roentgena 10A, 02-781 Warszawa

Wybory i marketing cyfrowy. Fraud w reklamie – analiza i wykrywanie oszustw na podstawie danych

Wybory i marketing cyfrowy. Fraud w reklamie – analiza i wykrywanie oszustw na podstawie danych

W erze cyfrowej, dane stały się jednym z najcenniejszych zasobów dla firm. Analiza danych pozwala na lepsze zrozumienie naszych klientów, a także na wykrycie wszelkiego rodzaju oszustw. W tym wpisie chcemy podkreślić ważność analizy danych, pokazując, jak można ją zastosować zarówno w marketingu (fraud w reklamie), jak i w analizie wyników wyborów.

Analogie między wyborami i marketingiem cyfrowym

Podobieństwo między wyborami a marketingiem może nie być na pierwszy rzut oka oczywiste, ale jeśli przyjrzymy się bliżej, zobaczymy wiele wspólnych wątków. Zarówno wybory, jak i kampanie marketingowe opierają się na analizie zachowań ludzi. W marketingu chcemy zrozumieć, co skłania ludzi do klikania reklam czy dokonywania zakupów, podczas gdy w wyborach chcemy wiedzieć, jakie czynniki wpłynęły na decyzję wyborczą.

Fraudy w marketingu cyfrowym i potencjalne oszustwa wyborcze mogą wpływać na wyniki w podobny sposób. W marketingu mamy do czynienia z fałszywymi kliknięciami lub manipulacją wynikami sprzedaży, zwłaszcza w kampaniach rozliczanych w modelu CPC czy CPS. Z drugiej strony, w wyborach mamy do czynienia z fałszywymi głosami czy manipulacją wynikami głosowania.

Jak wykryć fraud w reklamie i oszustwa w danych?

Najważniejszym krokiem w wykrywaniu oszustw jest analiza danych. Potrzebujemy narzędzi, które pomogą nam zrozumieć dane i wyciągnąć z nich wnioski.

Analiza zachowań użytkownika i ścieżek konwersji: Pozwala to na zrozumienie, jak użytkownik trafia na naszą stronę, jakie kroki podejmuje i gdzie może dochodzić do fałszywych działań.

Identyfikowanie anomalii w danych: Jeśli zauważymy nieoczekiwane skoki w danych lub nietypowe wzorce ruchu, może to być oznaką oszustwa.

Analiza techniczna: Sprawdzanie adresów IP i identyfikatorów przeglądarki pozwala na wykrycie fałszywych kliknięć czy manipulacji.

W kontekście wyborów, analiza danych może pomóc w identyfikacji anomalii w wynikach głosowania. Na przykład, jeśli w jednym okręgu wyborczym zauważymy znacząco wyższe poparcie dla jednego kandydata w porównaniu do innych okręgów, może to być oznaką potencjalnego oszustwa.

Jak interpretować wykresy?

Histogramy i krzywe gęstości prawdopodobieństwa są niezwykle przydatne w analizie danych. Pomagają one wizualizować rozkład danych i zrozumieć, gdzie mogą występować anomalie.

W przypadku danych dotyczących kampanii reklamowych możemy zauważyć, że w pewnych godzinach mamy znacznie więcej kliknięć niż w innych. Jeśli te wzorce są stałe przez kilka dni, możemy być pewni, że są one prawidłowe. Jednak jeśli zauważymy nagły skok w kliknięciach w pewnym konkretnym momencie, może to być oznaką fałszywych kliknięć.

Dane dotyczące przykładowej kampanii reklamowej i klikalności rozłożonej na godziny przedstawia Wykres 1.

W przypadku kampanii reklamowych, warto przestudiować dane względem czasu kampanii. Bazując na Wykresie 2. można dokonać kilku obserwacji i interpretacji w kontekście możliwych anomalii i potencjalnego fraudu.

Wykres 2. Zmienność wskaźnika CTR (% Click-Through Rate) w czasie

Ogólna struktura danych: Wykres prezentuje zmienność wskaźnika CTR (% Click-Through Rate) w czasie. Widoczna jest linia trendu, która sugeruje ogólny kierunek zmienności wskaźnika. Linia trendu pokazuje stabilne wartości CTR, które rosną w określonych punktach.

  1. Wyraźne szczyty: Widoczne są wyraźne szczyty (wyższe wartości CTR) w kilku miejscach wykresu. Jeśli takie wyraźne szczyty nie mają logicznego wyjaśnienia (np. święta, ważne wydarzenia), mogą sugerować pewne nieprawidłowości. Może to być wynikiem nienaturalnego, sztucznego napędzania kliknięć.
  2. Linia trendu vs. rzeczywiste wartości: W miejscach, gdzie rzeczywiste wartości CTR znacznie odbiegają od linii trendu, warto dokładniej przyjrzeć się danym. Te odchylenia mogą wskazywać na potencjalne oszustwa, zwłaszcza jeśli nie można ich wyjaśnić żadnymi konkretnymi działaniami marketingowymi lub innymi zewnętrznymi czynnikami.
  3. Konsystencja wzrostów: Jeśli wzrosty CTR pojawiają się regularnie i w podobnych odstępach czasu, może to wskazywać na automatyczne, sztuczne zwiększanie kliknięć. Jeśli jednak wzrosty są sporadyczne i nieprzewidywalne, mogą wynikać z rzeczywistych działań marketingowych.
  4. Nieregularności w niskich wartościach: Co ważne, niskie wartości CTR, które są znacznie niższe niż średnia, także mogą być interesujące. Jeśli pojawiają się nagle i bez wyraźnej przyczyny, mogą sugerować problemy techniczne, np. błędy w implementacji kampanii.

Podsumowując, na wykresie można zauważyć kilka potencjalnych obszarów, które mogą wskazywać na anomalię w kontekście fraudu. Oczywiście sama analiza wykresu nie daje pewności co do występowania oszustwa, ale może stanowić punkt wyjścia do dalszej, bardziej szczegółowej analizy. Aby uzyskać dokładniejsze informacje, warto byłoby przyjrzeć się dokładnym danym oraz kontekstowi w jakim te dane zostały zebrane.

  1. Kontekst: Istotne jest zrozumienie źródła tych danych. Czy pochodzą one z jednej kampanii reklamowej? Czy z różnych kanałów (np. reklamy mobilne, reklamy wideo)? Czy były jakieś wydarzenia marketingowe lub promocje w czasie, kiedy wystąpiły te skoki?
  2. Źródło ruchu: Warto przeanalizować, skąd pochodzi ruch w momentach, kiedy wskaźnik CTR jest wyjątkowo wysoki. Jeśli ruch pochodzi z podejrzanych źródeł lub z krajów, w których firma nie prowadzi aktywnych kampanii, może to być oznaka fałszywego ruchu.
  3. Porównanie z innymi metrykami: Czy inne metryki, takie jak konwersje, średni czas spędzony na stronie czy współczynnik odrzuceń, korelują z anomalią w CTR? Na przykład, jeśli CTR rośnie, ale współczynnik konwersji spada, może to sugerować niską jakość ruchu.
  4. Historia kampanii: Czy wcześniej były obserwowane podobne anomalie? Jeśli tak, to czy można je przypisać konkretnym wydarzeniom lub zmianom w strategii?
  5. Technologie śledzenia: Upewnij się, że technologie śledzenia są prawidłowo skonfigurowane i nie ma błędów, które mogłyby wpływać na dokładność danych.
  6. Analiza demograficzna: Jeśli dostępne są dane demograficzne, można sprawdzić, czy pewne grupy użytkowników zachowują się inaczej niż inne. Na przykład, jeśli duży wzrost CTR pochodzi od użytkowników z jednego regionu lub w określonym przedziale wiekowym, warto zastanowić się, czy może to wynikać z jakiegoś konkretnego powodu.

Podsumowując, identyfikacja potencjalnych anomalii w kontekście fraudu wymaga dogłębnej analizy danych oraz kontekstu, w jakim zostały one zebrane. Wskaźnik CTR jest jednym z wielu narzędzi, które można wykorzystać do monitorowania efektywności kampanii, ale ważne jest, aby nie polegać wyłącznie na jednej metryce, lecz brać pod uwagę całościowy obraz sytuacji.

Podobnie, analizując wyniki wyborów, możemy zauważyć, że w pewnych okręgach wyborczych poparcie dla pewnych kandydatów jest znacznie wyższe niż w innych. Jeśli te wzorce są spójne z poprzednimi wyborami czy z innymi danymi demograficznymi, możemy być pewni ich prawidłowości. Jednak jeśli zauważymy nagły skok w poparciu dla pewnego kandydata tylko w jednym okręgu, może to być oznaką oszustwa.

Na Wykresie 3. przedstawiono poparcie dla zwycięzcy w wyborach prezydenckich w roku 2012 w Rosji. Tak jest, wtedy Rosjanie ponownie wybrali Władimira Putina.

Tropiąc fałszerstwo na korzyść danej partii lub kandydata, lub roboty klikające w reklamy interesować będziemy się głównie prawą stroną rozkładu oryginalnego, prawą w stosunku do wartości średniej. Tam mogą wydarzyć się zjawiska, które będą zawyżały wynik wyborów lub nasze koszty.

Nieregularne, wysokie częstości – mogą świadczyć o nieprawidłowościach. Chodzi o nieregularności, których częstość oczekiwaną wyznacza krzywa funkcji gęstości prawdopodobieństwa rozkładu normalnego (krzywa na wykresach). Im bliżej wartości maksymalnej tym szansa wystąpienia słupków (wartości rzeczywistych) maleje, a nie rośnie jak np. na Wykresie 1.

Widzicie tę nieregularność po prawej stronie rozkładu?

Wykres 3. Rozkład głosów poparcia dla Władimira Putina w roku 2012

Jaki był rozkład poparcia dla największych ugrupowań w Polsce w roku 2019?

W przyrodzie nigdy nic nie jest idealne, szczególnie lewa strona rozkładu może budzić wątpliwości w przypadku głosów na Koalicję Obywatelską (KO) – Wykres 4. W Polsce ma to jednak związek z geografią wyborczą i anomalię tłumaczy podział na wschodnie i zachodnie regiony kraju, to trochę tak jakby badać dwie różne populacje.

Tak jak w przypadku danych z kampanii reklamowych, tak i tu istotny jest kontekst. Analiza geograficzna może często dostarczyć kluczowych informacji na temat anomalii w danych. W Polsce, na przykład, historyczne, kulturowe i społeczne różnice między wschodnimi a zachodnimi regionami kraju mogą prowadzić do odmiennych wyników wyborczych. Dlatego ważne jest, aby przy interpretacji danych uwzględnić tę specyfikę geograficzną. Różnice te mogą wynikać z odmiennych tradycji politycznych, historycznych doświadczeń czy też z aktualnych trendów społeczno-ekonomicznych.

Wykres 4. Rozkład głosów poparcia dla Koalicji Obywatelskiej w roku 2019

Wykres 5. Rozkład głosów poparcia dla Prawa i Sprawiedliwości w roku 2019

Co ważne, na obu wykresach brak jest nieregularności po prawej stronie rozkładu – a one mogłyby świadczyć o potencjalnych nieprawidłowościach.

Zastosowanie narzędzi analizy danych

Excel to podstawowe narzędzie, które może pomóc w analizie danych. Jednak jeśli chcemy przeprowadzać bardziej zaawansowane analizy, warto zastanowić się nad użyciem języka programowania Python i jego bibliotek statystycznych. Python pozwala na przeprowadzenie głębokiej analizy danych, identyfikację anomalii czy nawet tworzenie modeli predykcyjnych.

Bardzo przydatny może okazać się również ChatGPT, szczególnie w zestawie z Advanced Data Analysis. Pod kątem badania ruchu internetowego można wykorzystać CHEQ lub TrafficWatchDog.

Podsumowanie

Analiza danych jest kluczowa zarówno w marketingu, jak i w wyborach. Pozwala na lepsze zrozumienie zachowań ludzi i wykrycie wszelkiego rodzaju oszustw. Dzięki odpowiednim narzędziom i technikom możemy wyciągnąć z danych wartościowe informacje i podejmować lepsze decyzje.

Jeśli masz pytania dotyczące analizy danych czy chcesz dowiedzieć się, jak wykryć potencjalne oszustwa w Twoich kampaniach marketingowych, skontaktuj się z nami. Chętnie pomożemy!

WowMedia&Metrics logo

WowMedia&Metrics jest domem mediowym obsługującym firmy w zakresie mediów ATL i Digital, wykorzystując wiodące silniki AI i modelowanie Customer Journey.

Dołącz do #GenerationAI

Dane spółki

WowMedia&Metrics Sp. z o.o.

ul. Roentgena 10A
02-781 Warszawa

tel.: +48 22 487 83 01
office@wowmediametrics.com

KRS: 0000909894
REGON: 389400465
NIP/VAT: PL9512522396

© 2024 · WowMedia&Metrics · Wszystkie prawa zastrzeżone