즐겨찾기추가 시작페이지로
Toronto
+16...+20° C
로그인 회원가입 회원찾기 미니홈업체
회원로그인 회원로그인
정치
1,508
IT.과학
526
사회
687
경제
3,016
세계
328
생활.문화
301
연예가소식
795
전문가칼럼
458
HOT뉴스
3,410
더보기
현재접속자
MissyCanada   캐나다 뉴스   IT.과학   상세보기  
IT.과학 게시판입니다.
제목  레딧, 퍼플렉시티 등 AI 기업 상대로 *대규모 댓글 스크래핑* 소송 제기 2025-10-28 12:28:10
작성인
  root 카카오톡 공유버튼
조회 : 39   추천: 5


 

소셜 미디어 플랫폼 레딧(Reddit)이 인공지능 기업 퍼플렉시티 AI(Perplexity AI) 등 3개 회사를 상대로 ‘산업적 규모의 불법 데이터 스크래핑’을 이유로 소송을 제기했다.

레딧은 이들이 수백만 명의 사용자 댓글을 무단으로 수집해 상업적 이익을 취했다고 주장했다.

 

이번 소송은 뉴욕 연방법원에 제기됐으며, 피고에는 퍼플렉시티 외에도 리투아니아의 데이터 수집 기업 옥시랩스(Oxylabs UAB), 러시아 봇넷과 연관된 것으로 알려진 AWMProxy, 미국 텍사스 기반의 세르파피(SerpApi)가 포함됐다.

 

레딧의 최고법률책임자(CLO) 벤 리(Ben Lee)는 성명에서 “스크래퍼들은 기술적 보호 장치를 우회해 데이터를 훔치고, 이를 AI 훈련용으로 판매하고 있다”며 “레딧은 세계에서 가장 방대한 인간 대화 데이터베이스 중 하나이기 때문에 주요 표적이 되고 있다”고 밝혔다.

 

AI 기업의 ‘데이터 의존’ 정조준

퍼플렉시티는 이번 소송에 대해 공식적인 법적 대응을 시작하지는 않았지만, “공공 지식에 대한 자유롭고 공정한 접근은 기본권이며, 사실 기반 AI 답변을 제공하기 위한 우리의 접근 방식은 원칙적이고 책임감 있다”고 반박했다.

옥시랩스와 세르파피는 논평 요청에 응하지 않았고, AWMProxy 측은 연락이 닿지 않았다.

 

레딧은 소장에서 피고 기업들을 “은행 금고를 털지는 않았지만, 대신 장갑차를 침입한 잠재적 강도”에 비유했다.

이들은 레딧의 스크래핑 방지 시스템을 회피하고, 구글 검색 결과를 통해 레딧 콘텐츠를 직접 추출한 것으로 알려졌다.

 

소장에 따르면, 이 기업들은 신원을 위장하고, 위치를 숨기며, 스크래퍼를 위장해 데이터를 가져갔고, 퍼플렉시티는 이 데이터를 구매한 고객으로 지목되었다.

 

AI 산업 전반에 확산되는 데이터 분쟁

이번 소송은 레딧이 지난 6월 AI 기업 앤트로픽(Anthropic)을 상대로 제기한 유사한 소송에 이은 두 번째 법적 대응이다.

레딧은 당시에도 “AI 기업들이 데이터 접근 금지 요청을 무시했다”고 주장했으며, 해당 사건은 내년 1월 연방법원에서 심리될 예정이다.

 

AI 산업은 위키피디아, 뉴스 기사, 그리고 레딧과 같은 대형 커뮤니티 플랫폼에서 얻은 데이터를 언어 모델 훈련의 핵심 자원으로 활용하고 있다.

 

레딧은 이미 오픈AI, 구글 등과는 합법적인 데이터 라이선스 계약을 체결했으며, 이는 2024년 IPO(기업공개)를 앞두고 중요한 수익원으로 작용했다.

 

 

*CP24 글을 번역,편집한 것입니다.

추천  목록