Publikationsalarm: Crowdsourcing auf sensiblen Daten mit datenschutzgerechtem Text Rewriting

Big data technology and data science illustration. Data flow concept. Querying, analysing, visualizing complex information. Neural network for artificial intelligence. Data mining. Business analytics.

Die meisten Aufgaben im NLP erfordern gelabelte Daten. In diesem kürzlich veröffentlichten Beitrag (auf dem 17. Linguistic Annotation Workshop, der in Verbindung mit der ACL 2023 stattfand) untersuchen wir, wie die Entfernung persönlich identifizierbarer Informationen sowie die Anwendung von differentiellem Privacy Rewriting die Nutzung von Crowdsourcing für Texte mit datenschutzrelevanten Informationen ermöglicht.

Mehr zu erforschen