在生成AI时代的医疗内容创作
作者:Sarah Boufelja Aiham Taleb Marion Eigner Nikita Kozodoi Liza (Elizaveta) Zinovyeva 和 Nuno Castro,2024年7月3日,来自 Amazon Bedrock
关键要点
生成AI和大型语言模型LLM正被用于医疗行业,以加速医疗内容创作。使用LLM可将内容生成的时间从几周缩短至几小时。新的AI助手可以增强对生成内容的控制,同时确保内容的准确性和合规性。生成内容的个性化非常重要,以满足不同患者和医疗专业人员的需求。生成AI和基于变换器的大型语言模型LLM最近进入公众视野。这些模型在问答、文本摘要、代码和文本生成方面表现出色。目前,LLM已在一些公司的实际应用中,包括严格监管的医疗和生命科学行业HCLS。应用场景包括医疗信息提取、临床笔记摘要、市场营销内容生成以及医疗法律审查自动化MLR过程。本文探讨了如何利用LLM设计疾病意识的市场营销内容。
市场营销内容是HCLS公司的沟通策略关键组成部分。这个过程需要在技术内容的准确性与对目标受众的吸引力之间保持微妙的平衡。市场营销内容的主要目标是提高对特定健康状况的关注度,并在患者和医疗提供者之间传播可能的治疗知识。通过获取最新准确的信息,医疗提供者能够以更加知情的方式调整患者的治疗。然而,由于医疗内容的高度敏感性,内容生成过程往往较慢通常需要几天到几周,并可能经过多次同行评审和严格的监管合规检查。
那么,具备高级文本生成能力的LLM能否帮助简化该过程,并协助品牌经理和医疗专家进行内容生成与审查?
为回答这一问题,AWS生成AI创新中心最近开发了一款医疗内容生成AI助手。该系统基于Amazon Bedrock构建,利用LLM能力生成针对疾病意识的策划医疗内容。通过这款AI助手,我们可以有效地将整体生成时间从几周减少到几小时,同时赋予主题专家SME更大的控制权。这是通过自动化的修订功能实现的,用户可以通过互动反馈环直接与LLM互动并发送指令和评论。由于内容的修订通常是流程中的主要瓶颈,这一点尤其重要。
由于每一条医疗信息对患者的福祉都有深远影响,因此医疗内容生成需满足额外要求,并强调内容的准确性和精确性。因此,我们的系统还增加了额外的防护措施,用于事实检查和规则评估。这些模块的目标是评估生成文本的真实性以及其与预设规则和规定的一致性。通过这些附加功能,用户对LLM生成逻辑的透明度和控制力得以增强。
本文将带您了解实现细节和设计选择,主要集中在内容生成和修订模块方面。事实检查和规则评估的特殊内容将在后续文章中讨论。
云梯机场架构
内容创作过程的整体架构和主要步骤见图2。该解决方案是利用以下服务设计的:
Amazon Elastic Container Service (ECS):用于部署和管理我们的Streamlit用户界面。Amazon Lambda:用于运行后端代码,涵盖生成逻辑。Amazon Textract:用于文档解析、文本和布局提取。Amazon Bedrock:用于与支持的LLM和嵌入模型互动。Amazon Translate:用于内容翻译。Amazon Simple Storage Service (S3):用于文档和处理数据的缓存。工作流程如下:
用户选择一组医学参考文献,并在简报中提供有关市场营销内容的规则和额外指导。用户通过Streamlit用户界面与系统互动,首先上传文档,然后选择目标受众和语言。前端通过WebSocket API和API网关发送HTTPS请求,并触发第一个Amazon Lambda函数。Lambda函数触发Amazon Textract解析和提取PDF文档中的数据。提取的数据存储在S3存储桶中,然后作为输入传递给LLM,如步骤6和7所示。Lambda函数编码内容生成、摘要和内容修订的逻辑。可选地,在步骤9中,LLM生成的内容可以使用Amazon Translate翻译成其他语言。最后,LLM根据输入数据和提示生成新内容,并通过Lambda函数发送回WebSocket。准备生成管道的输入数据
为了生成准确的医疗内容,LLM会接收与特定疾病相关的一套策划科学数据,例如医学期刊、文章、网站等。这些文章由品牌经理、医疗专家及其他具有适当医学专业知识的SME选取。
输入数据还包括一个简报,描述生成内容应遵循的总体要求和规则语调、风格、目标受众、字数等。在传统的市场营销内容生成过程中,这一简报通常会发送给内容创作机构。
此外,还可以整合更复杂的规则或规定,例如保护健康信息隐私和安全的HIPAA隐私指南。此外,这些规则可以是通用的、普遍适用的,或者在某些情况下是特别具体的。例如,某些监管要求可能适用于某些市场/地区或特定疾病。我们的生成系统允许高度个性化,您可以通过简单调整输入数据轻松定制和专门化内容以适应新的设置。
内容应谨慎地适应目标受众,无论是患者还是医疗专业人员。确实,语调、风格和科学复杂性应根据读者对医疗概念的熟悉程度进行选择。内容个性化对HCLS公司尤为重要,特别是在其覆盖面广泛的情况下,它使得协同和提高区域团队的效率成为可能。
从系统设计的角度来看,我们可能需要处理大量策划的文章和科学期刊。如果特定疾病需要复杂的医学知识或依赖于最新的出版物,这一点尤其重要。此外,医学参考文献包含各种信息,结构可能是纯文本或更复杂的图像、嵌入的注解和表格。为了扩展系统,必须无缝解析、提取和存储这些信息。为此,我们使用Amazon Textract,这是一个用于实体识别和提取的机器学习服务。
处理完成后,输入数据通过API调用以上下文信息的形式发送给LLM。对于Anthropic Claude 3,上下文窗口可大至200K个tokens,我们可以选择使用原始科学语料,从而提高生成内容的质量虽然这会增加延迟,或者在使用它们输入生成管道之前对科学参考进行摘要。
医学引用的摘要是整体性能优化的一个关键步骤,通过利用LLM的摘要能力来实现。我们借助提示工程将我们的摘要指令发送给LLM。的重要一点是在执行摘要时,应尽可能保留文章的元数据,比如标题、作者、日期等。
要启动生成管道,用户可以将输入数据上传到用户界面。这将触发Textract并可选地触发摘要Lambda函数,这些函数在完成后会将处理过的数据写入S3存储桶。任何后续的Lambda函数都可以直接从S3读取其输入数据。通过从S3读取数据,我们避免了处理大负载时WebSocket通常遇到的限流问题。
内容生成
我们的解决方案主要依赖提示工程与Bedrock LLM互动。所有输入文章、简报和规则作为参数通过LangChain PromptTemplate对象提供给LLM。我们可以通过少量示例进一步引导LLM,例如说明引用风格。微调,特别是参数高效微调技术,可以使LLM更专注于医学知识,后续将进一步探讨。

我们的管道是多语言的,即可以生成不同语言的内容。例如,Claude 3训练了包括英语在内的数十种不同语言,并能够在这些语言之间进行翻译。然而,我们认识到在某些情况下,目标语言的复杂性可能需要专业工具,在这种情况下,我们可能需要使用Amazon Translate进行额外的翻译步骤。
图6:动画展示了一篇关于艾勒斯丹洛斯综合症、其原因、症状和并发症的文章生成过程
内容修订
修订是我们解决方案的重要功能,因为它使您可以通过迭代向LLM提供反馈来进一步调整生成的内容。由于该解决方案主要设计为助手,这些反馈循环使我们的工具能够与现有流程无缝集成,从而有效地协助SME设计准确的医疗内容。例如,用户可以强制实施在以前版本中未完美应用的规则,或简单提高某些部分的清晰度和准确性。修订可以应用于整个文本。用户也可以选择仅纠正个别段落。在这两种情况下,修订版本和反馈都将附加至新的提示中,并发送至LLM进行处理。
提交对LLM的指令后,Lambda函数会触发一个新的内容生成过程,使用更新的提示。为了保持整体的句法一致性,最好重新生成整篇文章,保留其他段落的不变。但是,也可以仅针对已提供反馈的部分进行重新生成。在这种情况下,应特别注意文本的一致性。该修订过程可以递归应用,通过改进上一版本,直到用户认为内容令人满意为止。
图8:动画展示了艾勒斯丹洛斯文章的修订过程。用户可以例如要求提供额外信息。
结论
随着对LLM生成文本质量的最新改进,生成AI已成为一种颠覆性技术,能够简化和优化广泛的流程和业务。
针对疾病意识的医疗内容生成是一个关键示例,展示了如何利用LLM在数小时内生成策划的高质量市场营销内容,从而实现显著的操作改进,并促进区域团队之间的协作。通过其修订功能,我们的解决方案能够与现有的传统流程无缝集成,成为真正的助手工具,增强医疗专家和品牌经理的能力。
针对疾病意识的市场营销内容也是一个高度受监管的用例的里程碑示例,其中生成内容的准确性和精确性至关重要。为帮助SME检测并纠正任何潜在谬误或错误陈述,我们设计了一个事实检查模块,旨在发现生成文本与源参考之间的潜在不一致。
此外,我们的规则评估功能可以通过自动突显规则或法规的任何不当实施,帮助SME进行MLR过程。借助这些补充防护措施,我们确保我们的生成管道的可扩展性和稳健性,因而安全和负责任地在工业和现实环境中部署AI。
参考文献
Vaswani Ashish等 “Attention is all you need” Advances in neural information processing systems 30 (2017)Brown Tom等 “Language models are fewshot learners” Advances in neural information processing systems 33 (2020) 18771901Mesk Bertalan 和 Eric J Topol “The imperative for regulatory oversight of large language models (or generative AI) in healthcare” NPJ digital medicine 1 (2023) 120Clusmann Jan等 “The future landscape of large language models in medicine” Communications medicine 1 (2023) 141He Kai等 “A survey of large language models for healthcare from data technology and applications to accountability and ethics” arXiv preprint arXiv231005694 (2023)Mu Weiyi等 “Factors affecting quality of life in children and adolescents with hypermobile EhlersDanlos syndrome/hypermobility spectrum disorders” American journal of medical genetics Part A 1794 (2019) 561569Berglund Britta Gun Nordstrm 和 Kim Ltzn “Living a restricted life with EhlersDanlos syndrome (EDS)” International Journal of Nursing Studies 372 (2000) 111118关于作者
Sarah Boufelja Y 是一名资深数据科学家,拥有超过8年的数据科学和机器学习经验。她在GenAII中心的角色中,与关键利益相关者合作,使用机器学习和生成AI工具解决商业问题。她的专业知识处于机器学习、概率论和最优运输的交汇点。
Liza (Elizaveta) Zinovyeva 是AWS生成AI创新中心的应用科学家,现居柏林。她帮助客户在不同行业中将生成AI集成到现有应用程序和工作流程中。她对AI/ML、金融和软件安全领域充满热情。在闲暇时间,她喜欢和家人共度时光、运动、学习新技术以及参加问答比赛。
Nikita Kozodoi 是AWS生成AI创新中心的应用科学家,他在这里构建和推进生成AI及ML解决方案,以解决来自各行业客户的实际商业问题。在闲暇时间,他热爱沙滩排球。
Marion Eigner 是一位生成AI战略家,曾领导多项生成AI解决方案的推出。她在企业转型和产品创新方面具有专业知识,专注于赋能企业快速原型、发布和扩展新产品和服务,利用生成AI。
Nuno Castro 是AWS生成AI创新中心的资深应用科学经理。他领导生成AI客户参与,帮助AWS客户从创意到原型和生产阶段发现最具影响力的用例。他在各个行业拥有17年的经验,其中包括金融、制造和旅游领域,担任ML团队领导已有10年。
![Aiham Taleb](