ਅਰਬੀ ਡਾਟਾਸੈੱਟ
مجموعة البيانات العربية
ਏਆਈ ਅਤੇ ਸਪੀਚ ਮਾਡਲਾਂ ਲਈ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀ ਅਰਬੀ ਜਨਰਲ ਗੱਲਬਾਤ, ਅਤੇ ਪੋਡਕਾਸਟ ਡੇਟਾਸੈੱਟ
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਅਰਬੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਆਮ ਗੱਲਬਾਤ
ਵੇਰਵਾ
ਦੋ ਵਿਅਕਤੀਆਂ ਵਿਚਕਾਰ ਗੈਰ-ਸਕ੍ਰਿਪਟ ਟੈਲੀਫੋਨ ਗੱਲਬਾਤ। ਲਗਭਗ. ਆਡੀਓ ਦੀ ਮਿਆਦ (ਸੀਮਾ) - 15-60 ਮਿੰਟ, ਖਾੜੀ ਦੇਸ਼ਾਂ ਤੋਂ ਅਰਬੀ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
292
ਨਮੂਨਾ ਦਰ
8 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਡਿਊਲ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਡੈਸਕਟਾਪ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਅਰਬੀ ਵਿਚ
ਭਾਸ਼ਾ
ਅਰਬੀ ਵਿਚ
ਲਿੰਗ
ਔਰਤ 838 ਮਰਦ 1209 ਅਣਜਾਣ 78
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
706
ਉੁਮਰ
18-50
ਸੰਖੇਪ ਜਾਣਕਾਰੀ
ਟਾਈਟਲ
ਅਰਬੀ ਭਾਸ਼ਾ ਡੇਟਾਸੈਟ
ਡਾਟਾਸੈੱਟ ਦੀ ਕਿਸਮ
ਟੀ.ਟੀ.ਐੱਸ
ਵੇਰਵਾ
ਸਿੰਗਲ-ਵਾਕ ਰਿਕਾਰਡਿੰਗ, ਜੋ 5 ਤੋਂ 30 ਸਕਿੰਟ ਦੀ ਰੇਂਜ ਵਿੱਚ ਆਉਂਦੀਆਂ ਹਨ।
ਕੇਸ ਵਰਤੋ
ASR, ਵਰਚੁਅਲ ਅਸਿਸਟੈਂਟ, ਚੈਟਬੋਟ, ਕਨਵਰਸੇਸ਼ਨਲ AI, ਸਪੀਚ ਐਨਾਲਿਟਿਕਸ, TTS, ਲੈਂਗੂਏਜ ਮਾਡਲਿੰਗ
ਡਾਟਾ ਸੈੱਟ ਵੇਰਵੇ
ਕੁੱਲ ਘੰਟੇ
1,947
ਨਮੂਨਾ ਦਰ
48 driver ਵਰਤਣ
ਆਡੀਓ ਚੈਨਲ
ਮੋਨੋ
ਰਿਕਾਰਡਿੰਗ ਪਲੇਟਫਾਰਮ
ਮੋਬਾਈਲ ਐਪ
ਆਡੀਓ ਫਾਰਮੈਟ
.ਵਾਵ
ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਫਾਰਮੈਟ
.json
WER (%)
5
ਡੈਟਾ ਸੈਟ ਜਨਸੰਖਿਆ
ਦੇਸ਼
ਅਰਬੀ ਵਿਚ
ਭਾਸ਼ਾ
ਅਰਬੀ ਵਿਚ
ਲਿੰਗ
ਔਰਤ 838 ਮਰਦ 1209 ਅਣਜਾਣ 78
ਬੋਲਣ ਵਾਲਿਆਂ ਦੀ ਗਿਣਤੀ
2,125
ਉੁਮਰ
18-50
ਫੀਚਰਡ ਕਲਾਇੰਟ
ਵਿਸ਼ਵ-ਮੋਹਰੀ ਏਆਈ ਉਤਪਾਦਾਂ ਨੂੰ ਬਣਾਉਣ ਲਈ ਟੀਮਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਨਾ.
ਜੋ ਤੁਸੀਂ ਲੱਭ ਰਹੇ ਹੋ ਉਹ ਨਹੀਂ ਲੱਭ ਸਕਦੇ?
ਸਾਰੇ ਡੇਟਾ ਕਿਸਮਾਂ ਵਿੱਚ ਨਵੇਂ ਆਫ-ਦੀ-ਸ਼ੈਲਫ ਡੇਟਾਸੇਟ ਇਕੱਠੇ ਕੀਤੇ ਜਾ ਰਹੇ ਹਨ
ਆਪਣੀਆਂ ਆਡੀਓ/ਸਪੀਚ ਸਿਖਲਾਈ ਡੇਟਾ ਇਕੱਤਰ ਕਰਨ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਨੂੰ ਦੂਰ ਕਰਨ ਲਈ ਹੁਣੇ ਸਾਡੇ ਨਾਲ ਸੰਪਰਕ ਕਰੋ