1. 首页 > 国际教育

瑞典KTH皇家理工学院【对话动态生成模型博士生】博士项目招生中!

【脉石国际留学】由顶级高校教授博士团队组成,为您提供【海外博士】从申请、入学、直至毕业的一站式保姆级服务。多对一守护你的申请过程,致力于抹平留学中的一切信息差。帮助您追求更高的学术梦想,让您从容地开启留学生活。

01

学校及专业介绍


QS世界大学排名

2025年排名74


泰晤士世界大学排名

2024年排名97


USNews

2024年排名240

KTH Royal Institute of Technology



皇家理工学院(KTH Royal Institute of Technology)是瑞典斯德哥尔摩的一所公立研究型大学,成立于1827年,是瑞典规模最大的技术大学。KTH开展工程和技术领域的研究和教育,现拥有五个学院和四个校区。

KTH的历史可以追溯到1697年由瑞典科学家和创新者克里斯托弗·波尔海姆创立的机械实验室(Laboratorium mechanicum),这所实验室结合了教育技术、实验室和创新展示空间。1827年,机械学校(Mekaniska skolan)转变为技术学院(Teknologiska institutet),并在1877年更名为皇家理工学院(Kungliga Tekniska högskolan, KTH)。瑞典国王卡尔十六世·古斯塔夫是KTH的赞助人。

KTH还拥有瑞典最大的科技和基础科学图书馆,支持学生和研究人员的学术和数字技能。KTH图书馆致力于促进开放获取出版物,并为大学提供战略决策支持。图书馆的主要目标是提高教育和研究质量。

KTH提供广泛的本科研究生课程,涵盖工程、技术和科学领域。作为瑞典最大的技术大学,KTH在工程教育和研究方面贡献了瑞典三分之一的力量,拥有13,500名本科生、1,700名博士生和3,600名教职员工。


02

导师以及项目

1

导师简介

姓名:Éva Székely

职称:助理教授

部门:语言、音乐和听力系

教学:信息技术的人类感知









2

发表论文

[1]Wagner, P., Beskow, J., Betz, S., Edlund, J., Gustafson, J., Eje Henter, G., ... & Voße, J. (2019). Speech synthesis evaluation—state-of-the-art assessment and suggestion for a novel research program. In Proceedings of the 10th Speech Synthesis Workshop (SSW10).

[2]Székely, É., Henter, G. E., Beskow, J., & Gustafson, J. (2019, September). Spontaneous Conversational Speech Synthesis from Found Data. In Interspeech (pp. 4435-4439).

[3]Mehta, S., Tu, R., Beskow, J., Székely, É., & Henter, G. E. (2024, April). Matcha-TTS: A fast TTS architecture with conditional flow matching. In ICASSP 2024-2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 11341-11345). IEEE.








4

研究方向

她的研究兴趣是将富有表现力的语音合成作为一种人类交流工具。具体来说,她对合成语音中的多模态输入、情境适应和交互现象感兴趣。








03

当前可申请的博士项目

博士项目详情介绍

项目名称

对话动态生成模型博士生

(PhD Student in Generative Modelling of Conversational Dynamics)


项目目标

该项目的主要研究目标是创建一个能够生成口语对话的模型,使说话机器能够随着时间的推移自然地调整其对话风格,就像人类一样。具体目标包括:

  • 通过自我监督学习对人类对话中的语音模式、节奏和语调进行研究。

  • 利用研究结果构建一个更好的自适应文本转语音系统。

  • 整合文本转语音技术、对话系统和生成机器学习,以实现更自然、更包容的人机交互。


研究内容

  • 语音模式分析:研究人类对话中的语音模式、节奏和语调,探索这些因素如何影响对话的自然性和流畅度。

  • 自我监督学习:采用自我监督学习的方法,对大量的对话数据进行分析和训练,提取出关键的语音特征和模式。

  • 自适应文本转语音系统:基于语音模式分析的结果,开发一个能够自适应调整语音输出的文本转语音系统,使其在不同的对话情境中能够自然地调整语音风格。

  • 消除偏见:确保系统能够与说话者无关,避免传播现有的偏见,促进包容性的人机交互体验。

申请条件

  • 通过第二周期学位(例如硕士学位),或

  • 完成至少 240 个高等教育学分的课程要求,其中至少 60 个第二周期高等教育学分,或

  • 通过其他方式获得实质等同的知识。

  • 英语水平达到英语B/6水平。

  • 独立工作能力:展示在无监督情况下完成工作的能力。

  • 合作能力:展示与团队合作的经验和能力。

  • 专业方法:展示专业的方法论和研究方法。

  • 分析和处理复杂问题的能力:展示处理复杂技术问题的能力。

  • 编程技能:特别是深度学习方面的能力,包括使用 PyTorch 或类似程序。

  • 领域经验:在语音技术、大型语言模型、自监督学习和信号处理等方面的经验。


申请材料应包括

  • 简历: 包括相关专业经验和知识

  • 文凭和成绩单: 包括满足语言要求的证书。如果原始文件不是以英语或瑞典语之一签发,则需翻译成英语或瑞典语。原始文件的复印件必须经过认证。

  • 代表性出版物或技术报告: 对于较长的文档,请提供摘要和全文的网络链接。

本文由千千择校网发布,不代表千千择校网立场,转载联系作者并注明出处:https://www.qqzexiao.com/gjjy/499.html

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息