xBerry Case studies Copysearcher

Copysearcher

skuteczna detekcja plagiatu w czasie rzeczywistym

Zobacz video

Wszyscy uwielbiamy czytać wiadomości i plotki o celebrytach w Internecie. Z perspektywy użytkowników jest to czysta przyjemność, połączona z szybkością i wygodą zdobywania wiedzy. Ale co z wydawcami internetowymi? Wykonywanie ich pracy wymaga poświęcenia czasu i wysiłku, aby dostarczyć nam treści najwyższej jakości.

Niestety, plagiaty w sieci coraz częściej prowadzą do nielegalnego rozpowszechniania treści na nieuprawnionych stronach internetowych. Takie działania powodują bezpośrednie straty dla autorów oryginalnych treści. W xBerry przychodzimy na ratunek internetowym wydawcom i prezentujemy nasze innowacyjne narzędzie antyplagiatowe, które wykrywa nieuczciwe praktyki publikacji w czasie rzeczywistym.

Scroll pageg icon

Wyzwanie

Copysearcher został stworzony dla jednego z naszych partnerów, który specjalizuje się w tworzeniu treści czytanych przez miliony użytkowników każdego dnia.

 

Gdy Twój biznes opiera się na publikacji informacji i newsów, kluczowym jest, abyś jako pierwszy dotarł do swojej publiczności z najnowszymi informacjami. Publikacje, których nie znajdą na innych stronach, pomagają utrzymać ich zainteresowanie i lojalność. Wszyscy wiemy, dziennikarstwo kieruje się własnymi zasadami, a aby dobrze wykonywać tę trudną pracę pracę, należy włożyć wiele wysiłku w zdobycie niezbędnych informacji, sprawdzanie źródeł i przeprowadzanie wywiadów.

 

Niestety, nawet dostarczając treści najwyższej jakości, czasami trudno zachować ich ekskluzywność dla własnej publiczności. Niektórzy wydawcy wolą pójść na skróty i kopiować treści innych, licząc na to, że pozostaną niewykryci w nieskończonej otchłani internetu.

 

Plagiat jest jednym z najczęstszych złych praktyk stosowanych przez twórców treści online. Co gorsza, często nie kończy się tylko na inspiracji – kradzież treści jest bardziej powszechna, niż by się mogło wydawać. Nasz partner był zmotywowany do walki z takimi incydentami. My również – przy użyciu innowacyjnego podejścia antyplagiatowego dostosowanego do potrzeb twórców treści online.

Cele

Nasz cel był jasny - chcieliśmy stworzyć narzędzie, które śledzi plagiat treści w czasie rzeczywistym, dostarczając użytkownikom natychmiastowych informacji o każdym podmiocie, który skopiował treść.

Aby to osiągnąć, korzystaliśmy z przeglądarek internetowych w czasie rzeczywistym, aby przeszukiwać sieć i indeksować znalezione treści. Podążanie za prostym plagiatem typu „kopiuj-wklej” może nie było szczególnie trudne, ale wykrycie tekstu po parafrazie lub wyedytowanych obrazów i filmów to zupełnie inna historia. Musieliśmy znaleźć sposób na poprawę precyzji systemu i opracować proces wyszukiwania parafraz i zmienionych treści.

Ponadto chcieliśmy, aby nasze narzędzie pomagało wydawcom w podjęciu działań prawnych w celu eliminacji nielegalnie zduplikowanych treści na innych portalach.

Rozwiązanie

  • Wykorzystaliśmy przeglądarki internetowe w czasie rzeczywistym do przeszukiwania sieci i indeksowania treści.

  • Dzięki zaawansowanym technikom sztucznej inteligencji i przetwarzania obrazów, Copysearcher może przeskanować ponad 10 000 stron na godzinę.

  • Zastosowaliśmy wbudowane modele word embedding oraz głębokie sieci neuronowe do złożonego semantycznego dopasowywania tekstu, umożliwiając rozpoznawanie skopiowanych i parafrazowanych fragmentów tekstu.

  • Zastosowaliśmy detekcję obiektów w połączeniu z testami walidacyjnymi do rozpoznawania skopiowanych i edytowanych zdjęć oraz filmów.

  • Dodaliśmy łatwy dostęp do formularza Google "Usunięcie praw autorskich".

  • W celu ułatwienia kroków prawnych dodaliśmy możliwość wysłania bezpośredniego e-maila do osoby odpowiedzialnej za skopiowane treści oraz do ich zespołu prawnego.

Rezultat

Stworzyliśmy przyjazne dla użytkownika, intuicyjne narzędzie, które pozwala wydawcom śledzić plagiaty treści w sieci i umożliwia podjęcie dalszych działań prawnych.

 

Dzięki wbudowanemu łatwemu dostępowi, Copysearcher umożliwia natychmiastowe skorzystanie z opcji „Copyright Removal” w Google, a także kontakt z podmiotem, który dopuścił się plagiatu, lub zespołem prawnym tego wydawcy. Ze względu na wysoką wydajność i dostępność, Copysearcher pomógł naszemu partnerowi lepiej chronić swoje treści i maksymalizować ich wpływ, utrzymując uwagę swojej publiczności.

Tech Stack

KUBERNETES
DOCKER
PYTHON
FLASK
REACT
PYTORCH

Opinia klienta

Dzięki prototypowi (MVP), startup zabezpieczył drugą rundę finansowania, co otworzyło nam drogę do pełnowartościowej platformy. xBerry R&D House byli elastyczni i zwinni przez cały projekt. Zespół priorytetyzował dostarczenie rezultatów i dostosowywał się do zmian zakresu pracy bez większych trudności.

Mariusz Szypura CEO Copysearcher

Planujesz nowy projekt?

Porozmawiajmy Arrow icon