About: WaveNet

Facets (new session)
Description
Metadata
Settings
- Rule:
- Inverse Functional Properties:
- "Same As":

About: WaveNet Goto Sponge NotDistinct Permalink

An Entity of Type : owl:Thing, within Data Space : dbpedia.org associated with source document(s)
QRcode icon

http://dbpedia.org/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FWaveNet

WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music.

Attributes	Values
rdfs:label	WaveNet (es) WaveNet (en) WaveNet (sv) WaveNet (zh)
rdfs:comment	WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music. (en) WaveNet(波網)是一個用於直接生成聲音訊號的人工神經網路。由倫敦人工智慧公司DeepMind的研究人員於2016年9月的一篇論文中提出。 WaveNet通過使用用真實語音記錄訓練的神經網絡方法直接模擬波形，能夠生成聽起來相對真實的人類聲音。除了語音合成外，WaveNet也能應用在音樂生成以及語音辨識等領域。 2018年，Google在其雲端語音合成服務Google Cloud Text-to-Speech中提供了基於WaveNet的語音合成API。截至2019年，該產品提供了32種語言以及多種不同音色的語音合成服務，且基於WaveNet的合成結果在自然度上相比傳統方法更接近人類語音。 (zh) WaveNet es una red neuronal profunda para generar audio muestra a muestra. Está creada por investigadores de la empresa de inteligencia artificial de Londres DeepMind. La técnica, descrita en un artículo en septiembre de 2016, es capaz de generar sonidos realistas como voces humanas modelando formas de onda directamente mediante redes neuronales entrenadas directamente a partir de muestras del habla humana real. Pruebas realizadas con inglés y mandarín, mostraron que el sistema superaba los sistemas de síntesis del habla (text-to-speech, TTS) de Google, aunque aún es menos convincente que el discurso humano real. La capacidad de Wavenet para generar formas de onda permite modelar cualquier clase de audio, incluyendo música. Una empresa emergente canadiense llamada Lyrebird-AI ofrece tec (es) WaveNet är en AI-modell för ljud- och talgenerering som utvecklades av DeepMind, ett företag som ägs av Alphabet. Modellen är känd för sin förmåga att generera realistiskt ljud och tal, inklusive olika röster och språk, med hjälp av en neural nätverksarkitektur. WaveNet tränas på stora mängder ljud- och taldata, och använder sig av den här kunskapen för att generera nya ljud och talsekvenser som inte har existerat tidigare. (sv)
foaf:depiction
dcterms:subject	Google Speech synthesis Google acquisitions Artificial neural networks
Wikipage page ID	54133326 (xsd:integer)
Wikipage revision ID	1099026947 (xsd:integer)
Link from a Wikipage to another Wikipage	Neural network DeepMind Voice cloning Deep learning speech synthesis 15.ai Google Speech synthesis Cortana (virtual assistant) Classical music Google Assistant Google I/O Convolutional neural network Siri Feedforward neural network Speech synthesis British Broadcasting Corporation Adobe Voco Google acquisitions Vocoder AI Amazon Alexa Quantization (signal processing) Artificial neural networks Autoencoder Softmax function Categorical distribution Μ-law
Link from a Wikipage to an external page	https://deepmind.com/blog/wavenet-a-generative-model-for-raw-audio/
sameAs	WaveNet WaveNet WaveNet WaveNet WaveNet WaveNet
dbp:wikiPageUsesTemplate	dbt:Reflist dbt:Short_description dbt:Machine_learning_bar dbt:Differentiable_computing
thumbnail	wiki-commons:Special:FilePath/WaveNet_animation.gif?width=300
has abstract	WaveNet es una red neuronal profunda para generar audio muestra a muestra. Está creada por investigadores de la empresa de inteligencia artificial de Londres DeepMind. La técnica, descrita en un artículo en septiembre de 2016, es capaz de generar sonidos realistas como voces humanas modelando formas de onda directamente mediante redes neuronales entrenadas directamente a partir de muestras del habla humana real. Pruebas realizadas con inglés y mandarín, mostraron que el sistema superaba los sistemas de síntesis del habla (text-to-speech, TTS) de Google, aunque aún es menos convincente que el discurso humano real. La capacidad de Wavenet para generar formas de onda permite modelar cualquier clase de audio, incluyendo música. Una empresa emergente canadiense llamada Lyrebird-AI ofrece tecnología similar, basada en un modelo de aprendizaje profundo diferente. (es) WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music. (en) WaveNet är en AI-modell för ljud- och talgenerering som utvecklades av DeepMind, ett företag som ägs av Alphabet. Modellen är känd för sin förmåga att generera realistiskt ljud och tal, inklusive olika röster och språk, med hjälp av en neural nätverksarkitektur. WaveNet tränas på stora mängder ljud- och taldata, och använder sig av den här kunskapen för att generera nya ljud och talsekvenser som inte har existerat tidigare. WaveNet har använts i olika sammanhang, till exempel för att skapa röstfunktioner i Google Assistent och förbättra kvaliteten på röstöversättningar. Modellen har även väckt uppmärksamhet för sin förmåga att generera realistiskt ljud och tal, och har använts för att skapa nya röster och ljudeffekter i musikproduktion. WaveNet är en del av DeepMinds forskningssatsning kring AI, där man utforskar möjligheterna med tekniken och hur den kan användas på olika områden. Målet med forskningen är att bidra till att utveckla AI på ett ansvarsfullt sätt och att hitta sätt att använda tekniken för att lösa viktiga problem och förbättra människors liv. (sv) WaveNet(波網)是一個用於直接生成聲音訊號的人工神經網路。由倫敦人工智慧公司DeepMind的研究人員於2016年9月的一篇論文中提出。 WaveNet通過使用用真實語音記錄訓練的神經網絡方法直接模擬波形，能夠生成聽起來相對真實的人類聲音。除了語音合成外，WaveNet也能應用在音樂生成以及語音辨識等領域。 2018年，Google在其雲端語音合成服務Google Cloud Text-to-Speech中提供了基於WaveNet的語音合成API。截至2019年，該產品提供了32種語言以及多種不同音色的語音合成服務，且基於WaveNet的合成結果在自然度上相比傳統方法更接近人類語音。 (zh)
prov:wasDerivedFrom	wikipedia-en:WaveNet?oldid=1099026947&ns=0
page length (characters) of wiki page	13991 (xsd:nonNegativeInteger)
foaf:isPrimaryTopicOf	wikipedia-en:WaveNet
is Link from a Wikipage to another Wikipage of	List of artificial intelligence projects Deep learning speech synthesis 15.ai Generative adversarial network DeepMind WaveNet Adobe Voco Google Wavenet Audio deepfake Speech Services Human image synthesis Synthetic media
is Wikipage redirect of	DeepMind WaveNet Google Wavenet
is foaf:primaryTopic of	wikipedia-en:WaveNet

Faceted Search & Find service v1.17_git139 as of Feb 29 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (378 GB total memory, 54 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software