
Wszyscy uwielbiamy czytać wiadomości i plotki o celebrytach w Internecie. Z perspektywy użytkowników jest to czysta przyjemność, połączona z szybkością i wygodą zdobywania wiedzy. Ale co z wydawcami internetowymi? Wykonywanie ich pracy wymaga poświęcenia czasu i wysiłku, aby dostarczyć nam treści najwyższej jakości.
Niestety, plagiaty w sieci coraz częściej prowadzą do nielegalnego rozpowszechniania treści na nieuprawnionych stronach internetowych. Takie działania powodują bezpośrednie straty dla autorów oryginalnych treści. W xBerry przychodzimy na ratunek internetowym wydawcom i prezentujemy nasze innowacyjne narzędzie antyplagiatowe, które wykrywa nieuczciwe praktyki publikacji w czasie rzeczywistym.

Wyzwanie
Copysearcher został stworzony dla jednego z naszych partnerów, który specjalizuje się w tworzeniu treści czytanych przez miliony użytkowników każdego dnia.
Gdy Twój biznes opiera się na publikacji informacji i newsów, kluczowym jest, abyś jako pierwszy dotarł do swojej publiczności z najnowszymi informacjami. Publikacje, których nie znajdą na innych stronach, pomagają utrzymać ich zainteresowanie i lojalność. Wszyscy wiemy, dziennikarstwo kieruje się własnymi zasadami, a aby dobrze wykonywać tę trudną pracę pracę, należy włożyć wiele wysiłku w zdobycie niezbędnych informacji, sprawdzanie źródeł i przeprowadzanie wywiadów.
Niestety, nawet dostarczając treści najwyższej jakości, czasami trudno zachować ich ekskluzywność dla własnej publiczności. Niektórzy wydawcy wolą pójść na skróty i kopiować treści innych, licząc na to, że pozostaną niewykryci w nieskończonej otchłani internetu.
Plagiat jest jednym z najczęstszych złych praktyk stosowanych przez twórców treści online. Co gorsza, często nie kończy się tylko na inspiracji – kradzież treści jest bardziej powszechna, niż by się mogło wydawać. Nasz partner był zmotywowany do walki z takimi incydentami. My również – przy użyciu innowacyjnego podejścia antyplagiatowego dostosowanego do potrzeb twórców treści online.
Cele
Nasz cel był jasny - chcieliśmy stworzyć narzędzie, które śledzi plagiat treści w czasie rzeczywistym, dostarczając użytkownikom natychmiastowych informacji o każdym podmiocie, który skopiował treść.
Aby to osiągnąć, korzystaliśmy z przeglądarek internetowych w czasie rzeczywistym, aby przeszukiwać sieć i indeksować znalezione treści. Podążanie za prostym plagiatem typu „kopiuj-wklej” może nie było szczególnie trudne, ale wykrycie tekstu po parafrazie lub wyedytowanych obrazów i filmów to zupełnie inna historia. Musieliśmy znaleźć sposób na poprawę precyzji systemu i opracować proces wyszukiwania parafraz i zmienionych treści.
Ponadto chcieliśmy, aby nasze narzędzie pomagało wydawcom w podjęciu działań prawnych w celu eliminacji nielegalnie zduplikowanych treści na innych portalach.
Rozwiązanie
-
Wykorzystaliśmy przeglądarki internetowe w czasie rzeczywistym do przeszukiwania sieci i indeksowania treści.
-
Dzięki zaawansowanym technikom sztucznej inteligencji i przetwarzania obrazów, Copysearcher może przeskanować ponad 10 000 stron na godzinę.
-
Zastosowaliśmy wbudowane modele word embedding oraz głębokie sieci neuronowe do złożonego semantycznego dopasowywania tekstu, umożliwiając rozpoznawanie skopiowanych i parafrazowanych fragmentów tekstu.
-
Zastosowaliśmy detekcję obiektów w połączeniu z testami walidacyjnymi do rozpoznawania skopiowanych i edytowanych zdjęć oraz filmów.
-
Dodaliśmy łatwy dostęp do formularza Google "Usunięcie praw autorskich".
-
W celu ułatwienia kroków prawnych dodaliśmy możliwość wysłania bezpośredniego e-maila do osoby odpowiedzialnej za skopiowane treści oraz do ich zespołu prawnego.

Rezultat
Stworzyliśmy przyjazne dla użytkownika, intuicyjne narzędzie, które pozwala wydawcom śledzić plagiaty treści w sieci i umożliwia podjęcie dalszych działań prawnych.
Dzięki wbudowanemu łatwemu dostępowi, Copysearcher umożliwia natychmiastowe skorzystanie z opcji „Copyright Removal” w Google, a także kontakt z podmiotem, który dopuścił się plagiatu, lub zespołem prawnym tego wydawcy. Ze względu na wysoką wydajność i dostępność, Copysearcher pomógł naszemu partnerowi lepiej chronić swoje treści i maksymalizować ich wpływ, utrzymując uwagę swojej publiczności.
Tech Stack
Opinia klienta
Dzięki prototypowi (MVP), startup zabezpieczył drugą rundę finansowania, co otworzyło nam drogę do pełnowartościowej platformy. xBerry R&D House byli elastyczni i zwinni przez cały projekt. Zespół priorytetyzował dostarczenie rezultatów i dostosowywał się do zmian zakresu pracy bez większych trudności.