ਬੋਸਟਨ ਇੰਗਲਿਸ਼ ਡਾਟਾਸੈੱਟ
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਕਾਲ-ਸੈਂਟਰ
ਖੱਬਾ ਚੈਨਲ
ਸੱਜਾ ਚੈਨਲ
ਵੇਰਵਾ
"ਏਜੰਟ" ਅਤੇ "ਗਾਹਕ" ਵਿਚਕਾਰ ਗੈਰ-ਸਕ੍ਰਿਪਟ, ਸਿੰਥੈਟਿਕ ਟੈਲੀਫੋਨ ਗੱਲਬਾਤ, ਲਗਭਗ। ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) 5-15 ਮਿੰਟ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
177
ਨਮੂਨਾ ਦਰ
8 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਡਿਊਲ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਡੈਸਕਟਾਪ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਭਾਸ਼ਾ
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਲਿੰਗ
ਔਰਤ: 605, ਮਰਦ: 711, ਅਤੇ ਅਣਜਾਣ: 0
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
2,632
ਉੁਮਰ
18-50
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਆਮ ਗੱਲਬਾਤ
ਖੱਬਾ ਚੈਨਲ
ਸੱਜਾ ਚੈਨਲ
ਵੇਰਵਾ
ਦੋ ਵਿਅਕਤੀਆਂ ਵਿਚਕਾਰ ਗੈਰ-ਸਕ੍ਰਿਪਟ ਟੈਲੀਫੋਨ ਗੱਲਬਾਤ। ਲਗਭਗ. ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) - 15-60 ਮਿੰਟ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
32
ਨਮੂਨਾ ਦਰ
8 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਡਿਊਲ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਡੈਸਕਟਾਪ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਭਾਸ਼ਾ
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਲਿੰਗ
ਔਰਤ: 53, ਮਰਦ: 83, ਅਤੇ ਅਣਜਾਣ: 0
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
136
ਉੁਮਰ
18-50
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਵੇਰਵਾ
ਲਾਇਸੰਸਯੋਗ ਪਬਲਿਕ ਡੋਮੇਨ ਆਡੀਓ/ਵੀਡੀਓ ਫਾਈਲਾਂ ਜਿਵੇਂ ਕਿ ਇੰਟਰਵਿਊ, ਪੋਡਕਾਸਟ ਆਦਿ - 1 ਤੋਂ 5 ਲੋਕ। ਲਗਭਗ. ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) 15-60 ਮਿੰਟ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
93
ਨਮੂਨਾ ਦਰ
16 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਮੋਨੋ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਵੈੱਬ ਸੋਰਸਿੰਗ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਭਾਸ਼ਾ
ਬੋਸਟਨ ਅੰਗਰੇਜ਼ੀ
ਲਿੰਗ
ਔਰਤ: 43, ਮਰਦ: 181, ਅਤੇ ਅਣਜਾਣ: 2
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
226
ਉੁਮਰ
18-50
ਫੀਚਰਡ ਕਲਾਇੰਟ
ਵਿਸ਼ਵ-ਮੋਹਰੀ ਏਆਈ ਉਤਪਾਦਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਟੀਮਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ.
ਜੋ ਤੁਸੀਂ ਲੱਭ ਰਹੇ ਹੋ ਉਹ ਨਹੀਂ ਲੱਭ ਸਕਦੇ?
ਸਾਰੇ ਡੇਟਾ ਕਿਸਮਾਂ ਵਿੱਚ ਨਵੇਂ ਆਫ-ਦੀ-ਸ਼ੈਲਫ ਡੇਟਾਸੇਟ ਇਕੱਠੇ ਕੀਤੇ ਜਾ ਰਹੇ ਹਨ
ਆਪਣੀਆਂ ਆਡੀਓ/ਸਪੀਚ ਸਿਖਲਾਈ ਡੇਟਾ ਇਕੱਤਰ ਕਰਨ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ ਹੁਣੇ ਸਾਡੇ ਨਾਲ ਸੰਪਰਕ ਕਰੋ