为解决校园用户访问人工智能过程中的隐私、可访问性以及公平性等问题,密歇根大学决定开发自己的封闭生成式人工智能工具,供校园内部使用。
1挑战和机遇并存
一项校园委员会的研究结果显示,密歇根大学的IT领导层在2023年7月面临着一种有趣而紧张的挑战。
一方面,来自OpenAI的ChatGPT横空出世,带来了一系列潜在的问题,如隐私泄露、可访问性以及公平性,这些是公立高等教育机构必须思考的问题。例如,在ChatGPT上查询的数据会与OpenAI共享,这似乎涉及隐私泄露;再比如,ChatGPT与密歇根大学所使用的网络可访问性技术不同,这意味着它存在与大多数学生电子设备不兼容的问题。
另一方面,IT领导层一致认为,作为大型研究型大学,密歇根大学有义务向所有想要探索人工智能的用户——研究人员、教师、学生支持专业人员、运营人员和学生等等,提供最新的人工智能工具。
密歇根大学负责信息技术的副校长兼首席信息拉维·彭德思 (Ravi Pendse)说:“我们的愿景是成为生成式人工智能领域的领导者。这不仅是为了我们的同行,也为了世界上的其他人。我们希望为整个社会提供公平、负责任和前瞻性的技术。”
而另外一项挑战则是公平性问题。由密歇根大学教务长和彭德思组建,由来自全校不同学科的20名教师、学生和工作人员组成的密歇根大学生成式人工智能咨询委员会提到了这个问题:ChatGPT的会员制,相较于免费版本,付费版本提供更高级的功能和服务。但若不同学生选择不同版本的产品,将导致信息不对等,进一步加剧学生之间的不平等。
该委员会于2023年6月30日发布了报告,详细阐述了对人工智能在学校应用中潜在的隐私泄露、可访问性以及公平性等问题的担忧。报告的其中一项提议是尽快创建、调试和提供安全、可公平访问的基础型和高级研究型生成式人工智能工具。
彭德思说:“这份报告是一个很好的开端。密歇根大学是一所引领时代潮流的大学,我们将坚持走下去。因此,我们决定制造一个自己的沙盒来测试这些人工智能工具。”
彭德思和密歇根大学信息与技术服务部(ITS)开始着手为校园开发定制人工智能工具,以取代OpenAI和其他公司的新兴产品。ITS 负责新兴技术和支持服务的执行董事罗伯特·琼斯(Robert Jones)说:“虽然很多人在做生成式人工智能产品,但我们没有看到任何人以包容、公平和可访问性为首要目标,而这正是我们认为可以有所作为的方向。”
ITS构想了一套工具来满足大型研究型大学对广度和深度的需求:
一个类似于ChatGPT的问答工具;
一个无代码平台,允许校园内的不同部门针对特定环境开发自己的基于人工智能的工具;
一个工具包,开发人员和研究人员可以利用它建立、训练和托管自己的人工智能模型和环境。
ITS知道,“封闭式人工智能”是其构想的关键。在这里,信息将被保密,而不是利用用户的查询信息来不断地训练和调整人工智能。密歇根大学的工具所依赖的语言模型将由ITS工作人员进行更新和调整。
该报告还指出,由于社会上已经在使用OpenAI产品,生成式人工智能所带来的挑战迫在眉睫。密歇根大学的领导们希望在2023年的秋季,返回校园的学生、教师和研究人员将会发现有一套生成式人工智能工具正在等待着他们。这套工具有三个优点:利用封闭式人工智能方法保护隐私、可免费使用、无障碍设计。他们给自己设定的期限是在2023年8月21日前完成这套工具。
2研发过程
罗伯特·琼斯说:“这是一个非常独特的项目,它汇集了供应商资源和内部软件开发资源,以建立满足密歇根大学特定需求的定制化人工智能服务。”
2023年的整个夏天,密歇根大学的相关技术团队成员都在努力创建和测试密歇根大学的人工智能工具。为此,他们从微软公司获得了在密歇根州隔离墙环境中使用其大型语言模型的许可,如此一来,用户的查询信息将不会与OpenAI共享了。
这种方式促使技术团队部署其他语言模型,包括密歇根州所开发的任何语言模型。“你会注意到,我并没有说‘大语言’”,彭德思说,“如果你有经过验证的数据,你可以用一个小得多的模型得到同样准确的结果”。
团队由十几个人组成,包括两名前端开发员、一名全栈开发员和其他几名辅助人员。在谈及迫在眉睫的工具交付期限时,琼斯说:“执行董事们给予了我们极大的支持并且慷慨解囊。高层领导组建了一支出色的团队。我们甚至不知道能否完成我们想做的事情。这是一个史无前例的大胆设想,而我们做出了承诺。如果存在问题,却没有答案,我们就会想办法解决。”
3研发成果
2023年8月21日,密歇根大学为返校的学生和员工准备了三款独特的生成式人工智能工具。
1.密歇根大学GPT(U-M GPT)是最像ChatGPT的工具。它能够回答问题、生成书面内容并提出建议。此外,U-M GPT还支持多种商业和开源语言模型和人工智能艺术生成器,从而扩大了其实用性和应用范围。U-M GPT还能与电子阅读设备兼容,因此比ChatGPT更易于使用。U-M GPT对密歇根大学所有成员免费开放。
2.密歇根大学Maizey(U-M Maizey)是一个无代码平台,允许用户通过使用自己的数据集结合密歇根大学的人工智能语言模型来构建独特的定制聊天程序,用户可以设计针对特定情境的人工智能体验,然后与密歇根大学的其他用户分享。各部门、单位或项目可以通过大学的收费系统来支付U-M Maizey的费用。
3.密歇根大学GPT工具包(U-M GPT 工具包)专为人工智能开发人员设计,用于控制正在构建、训练和托管的人工智能模型和环境。如果研发人员需要使用U-M GPT工具包,那么他们需要联系ITS人工智能团队来获得使用权。
这三种工具目前都被批准用于“中度敏感”数据。这意味着它们可以用于《家庭教育权利和隐私法案》(FERPA)所涵盖的信息,但还不能用于高度敏感数据,如受保护的健康信息(HIPAA)。
4密歇根大学校园内部的使用情况
目前,密歇根大学的人工智能工具平均每天有15,000名用户使用,其中包括一部分将其作为课程作业的用户。例如,英语教师会要求学生使用密歇根大学GPT(U-M GPT)撰写论文初稿,然后在课堂上进行修改。
创建独特聊天工具的无代码平台——密歇根大学Maizey(U-M Maizey)已被广泛应用于各种项目中:
文学、科学和艺术学院的学生正在创建一个人工智能学术顾问,以处理常见问题。
采购部正在创建一个人工智能平台,帮助用户轻松完成招标书。
ITS为校园生活部创建了一个聊天机器人,帮助学生探索密歇根大学的1500多个学生组织。
密歇根大学图书馆正在创建一项自然语言图书推荐服务。密歇根大学的学生将可以提出这样的问题:“图书馆里有哪些关于早期荷兰绘画的好书?”或者 “哪些书能教我社会流行病学?”
罗斯商学院(Ross School of Business)的两位教师安德鲁·吴(Andrew Wu)和李俊(Jun Li)为他们的课程制作了一个人工智能导师。根据以往的课程数据,目前该课程正在为1000多名学生提供服务。两位教师在定性和定量问题上对人工智能导师进行了测试,发现其回答问题的效率达到或超过教授该课程老师的94%。在测试过程中,还发现人工智能导师在24%的时间内的表现优于 ChatGPT。
同时,密歇根大学GPT(U-M GPT)正在临床环境中进行实验,以优化患者病历和翻译处方笔记,以确保在适当的时候为患者提供非专利药物选择。
5为其他机构提供建议
自从推出封闭式人工智能工具套件以来,已有超过49家机构与密歇根大学取得了联系,就创建属于他们自己的人工智能工具寻求建议。密歇根大学向这些机构分享了经验,未来甚至可能借调一些IT人才给社区学院等小型机构,帮助他们开发自己的人工智能工具。
与此同时,密歇根大学正在继续构建和完善其人工智能工具。例如,在2025年,密歇根大学的学生可能会发现自己有了一个人工智能助手。密歇根大学还计划改进人工智能,使其将来能用于敏感的医疗信息,让大学的学术医疗中心从这些工具中获益更多。
6利用人工智能走向未来
从某种意义上,对于研发人员来说,人工智能已经存在了几十年。但是,生成式人工智能的到来开启了新时代,而像ChatGPT这样的公共工具已经让获取它的途径平民化。就像网络浏览器让非程序员也能使用互联网一样,生成式人工智能向所有人开放了人工智能的可能性,无论他们的技术水平如何。随之而来的是人们对自动化和失业的担忧。
彭德思说:“我对这些担忧感同身受。我们必须深思熟虑、小心谨慎地对待人工智能。但我坚信,生成式人工智能的真正价值在于挖掘和提升人类的潜力,而不是取代人类。人工智能不会抢走你的工作。但知道如何使用人工智能的人可能会。”他相信,密歇根大学的新工具不仅能让学生们进入一个被ChatGPT改变的世界,还能让他们掌握如何负责任地使用好这项技术的技能。