虚拟歌手是指被赋予虚拟角色(通常是二次元角色)的歌声合成引擎(使用来自人类的声音素材,通过各种方式合成带有音调的歌声)的声音库软件及其角色,如VOCALOID家族(“V家”)、Synthesizer V等。
| “ | Virtual singer, everyone creator. | ” |
虚拟歌手与虚拟偶像有部分相似点,但“歌声由计算机软件合成”是其主要特征。
2004年,VOCALOID(1代)技术首次问世,最初的VOCALOID虚拟歌手软件LEON、LOLA和MIRIAM由日本虚拟乐器软件进口和贩售公司Crypton Future Media邀请Zero-G制作,均为只能以英语合成声音的声音库软件,其技术也处于非常不成熟的阶段(合成的声音有明显机械感、声质上有噪声等)。尽管这些早期产品在技术上开创了先河,但在普及度和文化影响力上尚处于起步阶段。同年,Crypton公司制作并推出MEIKO声音库,此声音库以成熟的女性声音为特质,以日语为歌声语言,其首次启用了“在包装盒上提供可以联想到声库音色的角色形象”的概念,在贩售中获得明显超过预期的成绩(在当时卖出1000份虚拟乐器软件即大卖的基础上,卖出3000份)。
2007年,Crypton公司推出了初音未来(VOCALOID2),这是一款以日语歌声、年轻女性的清亮声音、明确的二次元角色设计为特点的VOCALOID声音库软件。初音未来的形象设计、清澈且有特色的歌声,以及日本开放的创作环境,使得她迅速成为了歌声合成业界乃至其他业界表现突出的角色,此后,以使用她进行创作的作品为源头,日本培养出了“VOCALOID文化”(虚拟歌手创作文化)。初音未来的成功,开启了VOCALOID音乐的黄金时代,吸引了大量创作者参与到VOCALOID音乐的创作中来(早期即有《甩葱歌Ievan Polkka》等歌曲“出圈”),后来VOCALOID音乐更是被传播到全球各大洲、各国家和地区。同时,人们发现,虚拟歌手拥有比传统偶像以及常规虚拟偶像更大的同人创作自由度与便利性。即使是以偶像模式运营的虚拟歌手,其歌曲也基本都不由企业官方制作,而是同人作品占比最高。随着初音未来的流行,其他的带有角色的虚拟歌手软件,如镜音铃·连、巡音流歌、等也相继问世。 新的虚拟歌手软件及角色,不仅增加了声库音色的多样性,也为更多/更特化的音乐风格和艺术表达提供了新的可能性。比如,镜音铃·连以其快速和电子音乐的风格被广大年轻人所喜爱,而巡音流歌的成熟音色则在成人听众中得到了更多的认可。
制作虚拟歌手声库软件,需要提供声音素材(大多数是人类声音),如人类演唱歌曲时的整段干声素材,或是针对特定语言的各个音素、发音和音高,专门请配音演员录制的大量采样等。对应的配音演员/声优称作虚拟歌手的Character Voice(CV)。
包括人工智能虚拟歌手在内,歌曲的制作需要音乐创作者花费时间进行调教(或称调声/调校)。
带有角色的虚拟歌手软件,由于其角色性,常常被称作虚拟偶像,但其与虚拟偶像概念不完全等同,称虚拟偶像为虚拟歌手是不正确的。
角色及声音女性化的虚拟歌手常被称作虚拟歌姬。相应地,有时候中国社区也把男性虚拟歌手称作虚拟歌基,但不太常见。
随着虚拟UP主的兴起,有一些歌势(以歌唱为主要内容)虚拟UP主自称“虚拟歌手”,比如最早的YuNi,以及后来神椿工作室旗下的花谱、异世界情绪等。这种称呼被一些人使用,尤其是在日本。
| 各类称呼或误称 |
|---|
|
自从初音未来大获成功之后,许多歌声合成软件都会与一个形象立绘一同推出,并以其为基础,推出对应的虚拟歌手角色,其中部分角色可以直观地展现声库的声音特点。角色人物设定的详略程度主要取决于管理者的运营理念。不过形象并不一定会在歌声合成软件的界面出现。这些虚拟歌手形象(角色性的一部分)在VOCALOID歌曲中的应用,不仅能丰富音乐作品的表现力,也能成为音乐创作与市场推广的重要元素。由于音色独特或人物设定丰富/人物设定大幅留白等,创作者有时能够通过VOCALOID歌曲表现复杂的情感、讲述丰富的故事。这种个性化的表达方式使得VOCALOID歌曲不仅成为技术的展示,还能成为情感共鸣的原因,使得听众能够借此与虚拟歌手建立某种情感连接。
多数虚拟歌手的设定是日本动漫风格的美少女,少数为男性、动物等,在性格/三围/经历等方面的具体人物设定通常并不十分明确。也有一些虚拟歌手官方并未给出具体形象,用相对抽象的图案代表。在PV和MMD的创作中,虚拟歌手的形象(服饰、发型、表情等)常常由创作者根据歌曲的主题和情感进行定制化调整,这不仅丰富了虚拟歌手们的角色深度,也统一了PV和MMD中的视觉风格与音乐主题,增强整体的艺术效果,并加深歌曲的表达效果和观众的感受。例如,在由ryo创作的歌曲《World is Mine》中的初音未来展示了一种高傲、稍带任性的形象,与歌曲中的“公主”主题相契合。
人物设定及二次创作限制比较宽松的虚拟歌手往往可以展现极高的多样性,有些类似通配角色,可以以其为介质,搭配不同的背景故事、不同的音乐风格。每位作者的作品中的虚拟歌手形象都不尽相同。也有些歌曲的PV中不出现演唱此曲的虚拟歌手(使用原创角色、第三方角色或是不使用角色)。
萌娘百科主要收录具有独立二次元形象的虚拟歌手,详见萌娘百科:收录范围。
虚拟歌手的技术核心是歌声合成软件,它们通过使用算法,将录制好的音频采样拼接或做其他处理,或通过使用AI(机器学习)模型来生成符合人类语言发音的声音。歌声合成软件由声音库(声库)和编辑器两部分组成。
由于技术和用户自身的操作水平的限制,很多时候虚拟歌手难以还原很多属于人类歌手的特殊的唱法或情感表达,而且难免产生电子音。
很多人认为未来的歌声合成软件应该进一步减少或消除电子音、还原人声(此方向以SynthV AI、VOCALOID 6、CeVIO AI等各类AI类歌声合成软件为代表),但也有相当多的人认为虚拟歌手维持声音的机械感有独特的魅力(此方向以UTAU、VOCALOID4及过往版本、Crypton NT等各类拼接合成类歌声合成软件为代表)。在特定题材的作品中,有电子音特征的声线反而更符合主题。
另外,也有各种各样非常规的声音被制成音源。不同受众和作者的标准是不同的。两种方向仍均有企业或个人在积极进行开发工作。
仅仅输入歌词与曲调就直接合成歌声,通常会使合成的歌声感觉生涩,所以作者需要使用编辑器(英语:editor)通过调整歌声合成引擎及声音库支持的参数,对歌曲的每个发音表现实现更精确的控制。
由于技术原理的差异,不同软件中同名参数的效果略有不同。
也可以通过调整参数制造一些特殊的效果(常见的有修改gender参数制造性转效果等)。
引擎(英语:engine)是歌声合成软件的核心组件。在大多数情况下,合成引擎和编辑器是绑定在一起的,用户往往只需要操作编辑器即可。也有一些歌声合成软件的后端引擎与前端编辑器是分离且可更换的(如UTAU)。

声音库(英语:Voicebank、Voice Library)被认为是虚拟歌手的本体。
声音库往往不与编辑器捆绑,用户可以根据自身需要购买、安装。有的歌声合成软件会在编辑器的安装包中默认捆绑一个或多个声音库(或推出对应的捆绑包),方便用户试用。
由于技术原理的差异,为某一编辑器而制作的声音库一般不能在其他编辑器上使用,但同一品牌版本较新的编辑器往往可以向下兼容版本较旧的声音库。
声音库通常由企业在拥有声音素材(人声采样或歌声片段)的基础上使用专用工具制作,也有部分引擎开发方向个人提供声音库制作工具(或无需额外制作工具即可制作声音库,如UTAU)。
同一个虚拟歌手角色可能有多个适合不同软件的声音库(以洛天依为例,有VOCALOID 3代、4代、5代、ACE AI、X-Studio AI、哔哩哔哩“鸣实验室”AI的声音库),或者不同语言的声音库版本(以初音未来为例,有日文、中文(VOCALOID 4代、6代)及英文(VOCALOID 3代、4代、6代)声音库)供用户选择。
虚拟歌手的使用需要兼容的软硬件环境的支持。一般在主流配置的普通家用电脑(Windows PC、Apple Mac PC等)中就可以安装虚拟歌手软件。
也有一些虚拟歌手软件有智能手机版本(例如ACE Studio、Mobile VOCALOID Editor等),甚至专用的硬件(例如YAMAHA公司开发的VOCALOID KEYBOARD)。
也有在线版(网页版)的歌声合成工具,不需要安装在本地,可以在浏览器内直接工作,在线完成大部分功能。
虚拟歌手的获取方式可以分为免费和付费两种。付费的虚拟歌手长期存在盗版现象。
付费的虚拟歌手软件一般以盒装软件包(带有或不带有存储介质)或数字购买、下载的形式售卖使用权。也有在商业杂志和书籍里同捆激活码或光盘的情况。此外也有一部分虚拟歌手采取订阅制的形式收费。
一般会在虚拟歌手软件的包装盒正面印刷对应角色的官方立绘,内部放置有包括但不限于安装手册/使用规定/光盘/激活码等必要内容,有时还会附赠特典。
虚拟歌手的实体包装盒往往有一定的周边性质或者根本就是自愿加购的硬周边,有时即使并不会使用来创作音乐的听众,也会入手喜爱的虚拟歌手的实体包装盒用于收藏纪念。
声音提供者是虚拟歌手的声音来源。绝大多数虚拟歌手的声音是以某个(或某几个)人类的声音数据为基础制作的。(使用多个声音提供者的声音制作单个虚拟歌手时,通常需要额外制作工序,如巡音流歌(V2)英文版、初音未来(V4)中文版、洛天依(V4)日文版等)
许多情况下,虚拟歌手的声音提供者是虚拟歌手软件的宣传重点,出名的声优、演员所录制的虚拟歌手软件往往从一开始就获得大量关注,因此大多数声音提供者的信息都是公开的。
一些虚拟歌手的名字取自声音提供者本人,例如MIRIAM和Miriam Stockley,还有一些虚拟歌手与声音提供者同名,例如梦眠音梦(VOCALOID)和梦眠音梦。
部分声音提供者可能会为制作多个虚拟歌手软件而录制不同声音,这在非商业的虚拟歌手中较为常见,而涉及商业的虚拟歌手,则因企业与声音提供者的声音版权合同等原因,往往一位声音提供者的声音只会用于制作一个虚拟歌手软件。
声音提供者的一些特点、名梗可能会被某些创作者逆输入到对应的虚拟歌手角色身上。考哥.jpg
只有少数声音提供者会隐藏身份,例如歌爱雪、VY1、奕夕等,隐藏身份的原因有:未成年人、隐私考虑、不以声音提供者身份为卖点、公司签署合同等。
一些声音提供者会对虚拟歌手相关的创作活动表示关注,有时自身也会参与其中。部分虚拟歌手的声音提供者也是其经营者。
另外,也可以使用虚拟歌手技术保存人在某一时期的声音,甚至复原、重现已故的人的声音[2]。
除过以人声作为采样来源的虚拟歌手,也存在着不以人声作为采样来源,或不以采样拼接技术发声的音源,甚至远早于VOCALOID技术的发布和虚拟歌手这个概念的诞生。
1961年,大型计算机IBM7094演唱了《Daisy Bell》,是计算机语音合成的最早演示。1997年,YAMAHA发布了MU2000+PLG100-SG歌声合成扩展板,使用基于FM/Hardsync的共振峰成型技术实现歌声合成。
2008年,最早的免费歌声合成软件UTAU发布。当年起,便有人制作以钢琴、萨克斯等乐器声音为采样的、不以拟真人声为目的音源(即不演唱歌词、作为乐器使用),并逐渐开始有人尝试使用非人声采样拼接制作拟真人声、可演唱歌词的音源。无论是否拟真人声,不以生物声音作为采样的音源均被称作无生物音源(后此概念也逐渐扩展到犬吠、猫叫声等非人生物采样也可使用“无生物音源”的tag)。
最早的不以人声作为采样、声音拟人声、具有独立形象设计的虚拟歌手可能是发布于2011年的鸣波调,是声音采样自雅马哈开发的FM音频芯片YM2608的UTAU音源。
而首个进行商业化的无生物音源虚拟歌手是足立零,其UTAU版本发布于2018年,其声音以软件Audacity生成的正弦波和木琴作为采样,在2025年起确认将发布VOCALOID5和VOCALOID6声库,以正弦波、木琴、尺八等作为采样,展现出无生物音源的采样对象具有多样性。
由于无需真人演唱、录音,虚拟歌手的出现大大降低了制作歌曲的门槛,允许更多的人参与到歌曲创作中。
相比邀请真人歌手,使用虚拟歌手制作歌曲需要更少的人力、物力和财力等成本,因此不少同人创作者使用虚拟歌手制作歌曲。
有很多缺少钞能力的日本(乃至日本海外的)音乐人在创作生涯初期依靠虚拟歌手实现了音乐梦想。
虚拟歌手相关作品,尤其是PV作品,一般通过团队协作(音乐人、调教师、插画师、PV师)完成,但也有一些能够在一次创作中担当作词/作曲/编曲/调教/调声/绘画/音频或视频后期等全部制作工作的“一体机”大佬的存在。
很多虚拟歌手音乐人在网上会以Producer一词的缩写“P”结尾取名,称为“P主”。
与创作者、网络主播和艺人相似,虚拟歌手开发方/运营方通常会运营和推广其虚拟歌手软件及角色(内容运营、品牌运营等)。根据运营者的不同,通常包括个人运营、社团运营、企业运营、事务所运营等。其中,偶像化运营的虚拟歌手也属于虚拟偶像的一种。
用户在通过合法渠道获得虚拟歌手软件,并遵守商业虚拟歌手软件编辑器、声音库的最终用户许可协议(EULA),或非商业虚拟歌手软件的创作规约的前提下,即可使用虚拟歌手软件制作歌声,且在很多场合(如绝大多数VOCALOID声库),无需获得虚拟歌手软件制作者的正式许可,即可以特定方式使用制作的歌声(EULA和创作规约通常限制商业和公序良俗有关的情况)。然而,虚拟歌手角色/形象一般不随着虚拟歌手软件的EULA一同许可给虚拟歌手软件的用户自由使用。虚拟歌手相关的声音权利由声音提供者与声音库制作者/企业通过合同或其他方式约定。
由于虚拟歌手软件的角色实质是绘画艺术作品,因此虚拟歌手软件的角色没有人格权、肖像权、表演者权、名誉权等,通常由角色企业或声音库、角色的制作者行使其角色形象著作权。
直接使用或通过改变虚拟歌手角色形象进行的创作(插画、视频等视觉类艺术)为二次创作,为了维护创作环境、规范创作行为、保护角色或其声音,通常会由虚拟歌手运营方制定创作规约并公布。这些使用规定通常可以随声音库获取。
一些创作者可能会在投稿原唱是某位虚拟歌手的音乐/PV作品时使用类似“【XXX(虚拟歌手角色名)原创】”或是“XXXXXX(歌名) Feat.XXXX(虚拟歌手角色名)”格式的标题。这不代表虚拟歌手软件的角色本身可以成为著作权人。根据EULA,这也不代表虚拟歌手软件的制作者(们)、制作企业对相应的作品或录音制品天然地享有著作权和邻接权,然而,部分情况下,发行音乐或在作品中使用虚拟歌手软件的合成声音时,需向声音库制作企业支付费用或获得许可。
由于虚拟歌手文化与ACG文化有较强的关联性,虚拟歌手的活动范围大多数在东亚的网络平台,相关从业者也大多来源于此。除此以外,也有一些来自美国、欧洲和其它地区的虚拟歌手和相关从业者。
虚拟歌手的语言大多数为日语、汉语、英语、韩语等,少数为其它语言。过去的大多数情况下,受技术限制及CV限制,虚拟歌手的声音库通常仅能合成单个语言的声音,但也有一些擅长“跨语种调教”技巧的P主可以使用某语言的声音库数据制作出其它语言的作品。
随着人工智能技术的发展,虚拟歌手自身的语言限制也逐渐被打破[3]。
虚拟歌手作品通常在Bilibili、Niconico、YouTube等视频网站,或pixiv等绘画分享网站,X(Twitter)、微博等社交媒体网站发布。也有作品在抖音、TikTok等短视频平台发布。
部分有相关实力和条件的运营方会开设专门的网站接收投稿(如Crypton运营的创作分享网络平台piapro)。
虚拟歌手的活动形式非常自由且多样。可以跨多种媒体、多种平台、以多种载体形式推出作品,在虚拟或现实世界进行活动。
不少虚拟歌手以类似虚拟偶像的形式运营,或与各种IP作品进行联动,或是担任虚拟代言人等。
每一家运营方都会探索并采取符合自身具体情况的活动形式。有特殊身份的虚拟歌手也可能有特殊的活动形式。
虚拟歌手的运营方会通过品牌营销或内容活动征集等方式,吸引并留存优质创作者、为创作环境输血。例如,piapro作为Crypton运营的平台,频繁地作为征稿平台,为Crypton授权活动和授权商品等进行征稿。哔哩哔哩等网站有时也会应虚拟歌手运营方(新创华、上海禾念等企业)的要求协助征稿。
有相关能力和意愿的运营方,会以虚拟歌手的名义举办线上或线下演唱会,在演出上演奏各种各样的虚拟歌手原创乐曲。
由世嘉公司以初音未来名义举办的初音未来日的感谢祭是世界上第一场使用准全息投影技术举办的虚拟歌手演唱会。后续的“初音未来演唱会”系列演出是此类活动的代表。
通常以最早的官方账号的完整或非完整的角色设定文本,或原始虚拟形象草稿,或组织发布声音提供者招募信息为起点,过程时间长短不定,直到正式发行为止。
部分企业或个人会用众筹的方式获得制作虚拟歌手声音库需要的费用。
此期间可能会有少量活动,但活动归类较为模糊,可结合实际情况计入或不计入虚拟歌手活动。
通常会在此阶段发布试听(DEMO)歌曲或片段,并初步展示其角色官方立绘和声音、合成性能(可调性、流畅性、发音准确性、仿真性)等特征。
虚拟歌手软件可以推出重新制作的新版本,以优化其合成性能、拓展其发音方式、可合成语言或音色等。
版本更新时运营方通常会同时对形象(官方立绘等)进行修改,调整或更换。
考虑到虚拟歌手的音色稳定性,版本更新时,通常不会更换声音提供者(但也有例外情况)。
新版本推出后,旧版本软件可能会停止发行。
(待补充)
在ACG圈内最有影响力的歌声合成软件VOCALOID发行于2004年,2007年8月31日“初音未来”的发售在日本乃至全世界都掀起了巨大的热潮,使得虚拟歌手走进许多人的视野。
而随后2008年1月出现的免费软件UTAU则给人们提供了自行录制声库的可能。
与传统真人偶像或由人类扮演的虚拟偶像的社群相比,创作者在虚拟歌手的粉丝社群中有相对高的人气与影响力。
(待补充)
(待补充)
以实际数据为基础介绍,通常带有一定推荐性质。
萌娘百科当前收录的虚拟歌手相关榜单类节目有: