Los demandantes de una demanda colectiva que alegaban que OpenAI violó los derechos de privacidad de los datos de entrenamiento abandonaron su caso contra la compañía. Los documentos judiciales mostraron que el caso fue desestimado sin prejuicio y los demandantes pueden optar por presentar una nueva demanda.
La demanda, presentada por primera vez en junio de este año en el Distrito Norte de California, alegaba que el web scraper de OpenAI "violó los derechos de propiedad y privacidad de todas las personas cuya información personal fue recopilada y luego incorporada mediante apropiación indebida en los productos de [OpenAI]". La demanda no mencionó a los demandantes, quienes fueron identificados con iniciales. El despacho de abogados Clarkson presentó la demanda colectiva en su nombre.
OpenAI, al igual que otras compañías de IA generativa, recopila datos de manera pública disponible en internet para ayudar a entrenar modelos de lenguaje grandes.
Las preguntas sobre cómo las compañías de IA generativa, como OpenAI, consumen y utilizan datos de acceso público para entrenar sus modelos, han dado lugar a varias demandas. La mayoría de los casos se centran en la complicada cuestión de los derechos de autor en lugar de los derechos de privacidad. La comediante Sarah Silverman y los autores Christopher Golden y Richard Kadrey demandaron a OpenAI y Meta por supuestamente infringir derechos de autor para entrenar a GPT-4 y Llama 2.
En julio, la Comisión Federal de Comercio inició una investigación contra OpenAI por posible daño al consumidor a través de la recopilación de datos y la publicación de información falsa.
En agosto, OpenAI anunció que los propietarios de sitios web pueden bloquear ahora su web crawler. Varios sitios web, incluyendo editoriales de noticias como The New York Times, han bloqueado a OpenAI para evitar que recopile sus datos.