ਸਵਾਹਿਲੀ ਡਾਟਾਸੈੱਟ
Hifadhidata ya Kiswahili
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਸਵਾਹਿਲੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਕਾਲ-ਸੈਂਟਰ
ਵੇਰਵਾ
"ਏਜੰਟ" ਅਤੇ "ਗਾਹਕ" ਵਿਚਕਾਰ ਗੈਰ-ਸਕ੍ਰਿਪਟ, ਸਿੰਥੈਟਿਕ ਟੈਲੀਫੋਨ ਗੱਲਬਾਤ, ਲਗਭਗ। ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) 5-15 ਮਿੰਟ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
230
ਨਮੂਨਾ ਦਰ
8 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਡਿਊਲ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਡੈਸਕਟਾਪ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਸਵਾਹਿਲੀ
ਭਾਸ਼ਾ
ਸਵਾਹਿਲੀ
ਲਿੰਗ
ਔਰਤ 611, ਮਰਦ 833, ਅਣਜਾਣ 0
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
1,444
ਉੁਮਰ
18-50
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਸਵਾਹਿਲੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਮੀਡੀਆ ਆਡੀਓ
ਵੇਰਵਾ
ਲਾਇਸੰਸਯੋਗ ਪਬਲਿਕ ਡੋਮੇਨ ਆਡੀਓ/ਵੀਡੀਓ ਫਾਈਲਾਂ ਜਿਵੇਂ ਕਿ ਇੰਟਰਵਿਊ, ਪੋਡਕਾਸਟ ਆਦਿ - 1 ਤੋਂ 5 ਲੋਕ। ਲਗਭਗ. ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) 15-60 ਮਿੰਟ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
265
ਨਮੂਨਾ ਦਰ
16 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਮੋਨੋ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਵੈੱਬ ਸੋਰਸਿੰਗ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਸਵਾਹਿਲੀ
ਭਾਸ਼ਾ
ਸਵਾਹਿਲੀ
ਲਿੰਗ
ਔਰਤ 118, ਮਰਦ 493, ਅਣਜਾਣ 25
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
636
ਉੁਮਰ
18-50
ਫੀਚਰਡ ਕਲਾਇੰਟ
ਵਿਸ਼ਵ-ਮੋਹਰੀ ਏਆਈ ਉਤਪਾਦਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਟੀਮਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ.
ਜੋ ਤੁਸੀਂ ਲੱਭ ਰਹੇ ਹੋ ਉਹ ਨਹੀਂ ਲੱਭ ਸਕਦੇ?
ਸਾਰੇ ਡੇਟਾ ਕਿਸਮਾਂ ਵਿੱਚ ਨਵੇਂ ਆਫ-ਦੀ-ਸ਼ੈਲਫ ਡੇਟਾਸੇਟ ਇਕੱਠੇ ਕੀਤੇ ਜਾ ਰਹੇ ਹਨ
ਆਪਣੀਆਂ ਆਡੀਓ/ਸਪੀਚ ਸਿਖਲਾਈ ਡੇਟਾ ਇਕੱਤਰ ਕਰਨ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ ਹੁਣੇ ਸਾਡੇ ਨਾਲ ਸੰਪਰਕ ਕਰੋ