Среда, 2 октября, 2024

Вогон сегодня

Избранные новости из Галактики

Вогон сегодня
Криптовалюты

Amazon расследует обвинения в том, что Perplexity якобы скопировала веб-контент

Представители Amazon заявили, что облачное подразделение компании расследует заявления о том, что стартап Perplexity, занимающийся искусственным интеллектом, удаляет контент с веб-сайтов без разрешения. Это произошло после того, как несколько СМИ обвинили Perplexity в незаконном майнинге контента.

Предполагается, что Perplexity AI обходит веб-стандарт под названием «Протокол исключения роботов». Согласно отчету WIRED, протокол широко известен как robots.txt, с помощью которого веб-сайты определяют, к каким страницам могут получить доступ поисковые системы, искусственный интеллект и другие сканеры. Forbes также обвинил AI-стартап в плагиате работ журналистов.

Читайте также: SoftBank инвестирует в альтернативу искусственного интеллекта Perplexity от Google при оценке в 3 миллиарда долларов

Соблюдение файла robots.txt является обязательным для сайтов, использующих хостинг или серверы Amazon Web Services (AWS). Хотя большинство веб-сайтов следуют этому стандарту, закон никого не обязывает следовать протоколу.

Perplexity якобы нарушает веб-стандарты

Представитель Amazon Саманта Майова заявила в пятницу, что компания оценивает информацию о нарушении протокола Perplexity. Одно новостное издание WIRED обвинило Perplexity в краже контента с новостных сайтов, которые запрещают такую ​​практику. Важно помнить, что Perplexity использует AWS для своих серверных нужд.

Майова заявила в своем заявлении, что

«Условия обслуживания [Amazon] запрещают оскорбительные и незаконные действия, и наши клиенты несут ответственность за соблюдение этих условий», Источник: AP .

Представитель сообщил, что компания регулярно получает жалобы из различных источников на предполагаемые неправомерные действия. Он также добавил, что AWS работает со своими клиентами, чтобы понять проблемы, о которых сообщается.

Сара Платник, представитель Perplexity AI, заявила, что боты компании не получают доступ к веб-сайтам способом, который противоречит условиям использования AWS. Ранее в этом месяце WIRED опубликовал отчет о расследовании, в котором утверждалось, что на своем новостном сайте были опубликованы заголовки о модели искусственного интеллекта Perplexity, а также советы по конкретным темам. Результаты показали тщательно перефразированные истории, включая ложные утверждения, приписываемые WIRED.

Многочисленные издания обвинили ИИ-единорога в скрапинге контента

Forbes также выдвинул обвинения в адрес Perplexity, заявив, что компания занимается плагиатом с помощью новой функции под названием Perplexity Pages. Издание утверждает, что страницы, курируемые Perplexity на его платформе, отображают контент, аналогичный оригинальным сообщениям таких изданий, как Bloomberg и CNBC.

Вызывает беспокойство то, что Perplexity заслужила известность за правильную атрибуцию контента его создателям. Forbes утверждает, что в постах, набравших тысячи просмотров, в тексте не упоминаются первоначальные издатели. Он сказал, что Perplexity присваивает создателям только небольшие логотипы для ссылок, которые легко пропустить.

Читайте также: OpenAI и Microsoft подали в суд за нарушение авторских прав

Associated Press также сообщило, что Perplexity выдумал фальшивые цитаты и приписал их реальным людям, что вызывает тревогу. Perplexity привлекла внимание технологических инвесторов и недавно была оценена в 3 миллиарда долларов.

Стартап привлек более 100 миллионов долларов от таких инвесторов, как основатель Amazon Джефф Безос, главный научный сотрудник Meta Ян ЛеКун и главный научный сотрудник Google Джефф Дин. Недавно японский SoftBank также обязался инвестировать в стартап от 10 до 20 миллионов долларов.

Генеральный директор Perplexity Аравинд Сринивас заявил, что вопрос, поднятый WIRED, отражает «глубокое и фундаментальное непонимание» того, как Perplexity осуществляет свою деятельность. В нем говорится, что IP-адрес, обнаруженный публикацией во время очистки контента, управляется третьей стороной, которая предоставляет услуги сканирования и индексирования веб-страниц.


Криптополитический репортаж Аамира Шейха