搜索

人工智能安全实验室·上海交通大学
人工智能安全实验室·上海交通大学
  • 在读研究生
  • 近期事件
  • 科研成果
  • 联系我们
  • 浅色 深色 自动
杜巍

杜巍

博士研究生

上海交通大学

杜巍,上海交通大学网络安全空间学院博士在读,导师为刘功申,主要研究方向为人工智能安全。

研究方向
  • 人工智能安全
  • 后门攻击与防御
  • 自然语言处理
教育经历
  • 网络空间安全 博士, 2020-2025

    上海交通大学

  • 电子信息工程 学士, 2016-2020

    西安电子科技大学

论文列表

  • How Large Language Models Encode Context Knowledge? A Layer-Wise Probing Study
  • Backdoor NLP Models via AI-Generated Text
  • 《动手学大模型》系列编程实践教程
  • Revisiting the Information Capacity of Neural Network Watermarks: Upper Bound Estimation and Beyond
  • NWS: Natural Textual Backdoor Attacks via Word Substitution
  • FedPrompt: Communication-Efficient and Privacy-Preserving Prompt Tuning in Federated Learning
  • A Universal Identity Backdoor Attack against Speaker Verification based on Siamese Network
  • PPT: Backdoor Attacks on Pre-trained Models via Poisoned Prompt Tuning

由Hugo Blox Builder支持发布——免费开源网站,为创作者赋能。

Cite
复制 下载