Publication detail

BUT-CZAS: Database of czech anechoic speech

HÁJEK, V. HARÁR, P. SCHIMMEL, J. BURGET, R.

Original Title

BUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komoře

Czech Title

BUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komoře

English Title

BUT-CZAS: Database of czech anechoic speech

Type

journal article

Language

cs

Original Abstract

BUT-CZAS (Brno University of Technology, Czech Anechoic Speech) je databáze nahrávek lidského hlasu, pořízených v bezodrazové komoře Vysokého učení technického v Brně. Databáze obsahuje celkem 405 mono nahrávek čteného českého textu s bitovou hloubkou 24 bitů a vzorkovací frekvencí 48 kHz. Nahráváno bylo celkem 18 různých řečníků (9 žen a 9 mužů) ve věku od 16 do 76 let. Celková délka všech nahrávek je 315 minut. V nahrávkách dohromady zaznělo více než 40 tisíc verzí 1 747 unikátních slov. Při nahrávání byl kladen důraz především na dodržení stejných podmínek nahrávání ve vysoké kvalitě a na vyváženost zástupců všech skupin pohlaví a věku. Ke všem nahrávkám je k dispozici textový přepis.

Czech abstract

BUT-CZAS (Brno University of Technology, Czech Anechoic Speech) je databáze nahrávek lidského hlasu, pořízených v bezodrazové komoře Vysokého učení technického v Brně. Databáze obsahuje celkem 405 mono nahrávek čteného českého textu s bitovou hloubkou 24 bitů a vzorkovací frekvencí 48 kHz. Nahráváno bylo celkem 18 různých řečníků (9 žen a 9 mužů) ve věku od 16 do 76 let. Celková délka všech nahrávek je 315 minut. V nahrávkách dohromady zaznělo více než 40 tisíc verzí 1 747 unikátních slov. Při nahrávání byl kladen důraz především na dodržení stejných podmínek nahrávání ve vysoké kvalitě a na vyváženost zástupců všech skupin pohlaví a věku. Ke všem nahrávkám je k dispozici textový přepis.

English abstract

BUT-CZAS (Brno University of Technology, Czech Anechoic Speech) is a novel database of human voice recordings, acquired in the anechoic chamber. The database consists of 405 mono recordings of the reading task in the Czech language acquired using bit depth of 24 bit and sampling rate of 48 kHz. In total, 18 speakers (9 women, 9 men) aged between 16–76 years old were involved in the process. Total duration of all recordings is approximately 315 min (comprising more than 40 000 versions of 1747 unique words). The database is designed with particular emphasis on the recording environment, quality of the recordings and equality of both age and gender groups. The full transcript is available for all the recordings.

Keywords

speech; anechoic chamber; database

Released

30.04.2018

Publisher

International Society for Science and Engineering, o.s.

Location

Brno

Pages from

48

Pages to

52

Pages count

5

URL

BibTex


@article{BUT148715,
  author="Vojtěch {Hájek} and Pavol {Harár} and Jiří {Schimmel} and Radim {Burget}",
  title="BUT-CZAS: Korpus kvalitních nahrávek české řeči pořízených v bezodrazové komoře",
  annote="BUT-CZAS (Brno University of Technology, Czech Anechoic Speech) je databáze nahrávek lidského hlasu, pořízených v bezodrazové komoře Vysokého učení technického v Brně. Databáze obsahuje celkem 405 mono nahrávek čteného českého textu s bitovou hloubkou 24 bitů a vzorkovací frekvencí 48 kHz. Nahráváno bylo celkem 18 různých řečníků (9 žen a 9 mužů) ve věku od 16 do 76 let. Celková délka všech nahrávek je 315 minut. V nahrávkách dohromady zaznělo více než 40 tisíc verzí 1 747 unikátních slov. Při nahrávání byl kladen důraz především na dodržení stejných podmínek nahrávání ve vysoké kvalitě a na vyváženost zástupců všech skupin pohlaví a věku. Ke všem nahrávkám je k dispozici textový přepis.",
  address="International Society for Science and Engineering, o.s.",
  chapter="148715",
  howpublished="online",
  institution="International Society for Science and Engineering, o.s.",
  number="2",
  volume="20",
  year="2018",
  month="april",
  pages="48--52",
  publisher="International Society for Science and Engineering, o.s.",
  type="journal article"
}