ਕੇਸ ਸਟੱਡੀ: ਕਥਨ ਸੰਗ੍ਰਹਿ
7 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਹੁ-ਭਾਸ਼ਾਈ ਡਿਜੀਟਲ ਸਹਾਇਕ ਬਣਾਉਣ ਲਈ 13M+ ਉਚਾਰਣ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ
ਅਸਲ ਸੰਸਾਰ ਹੱਲ
ਡਾਟਾ ਜੋ ਗਲੋਬਲ ਵਾਰਤਾਲਾਪ ਨੂੰ ਸ਼ਕਤੀ ਦਿੰਦਾ ਹੈ
ਉਚਾਰਣ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਇਸ ਲਈ ਪੈਦਾ ਹੁੰਦੀ ਹੈ ਕਿਉਂਕਿ ਸਾਰੇ ਗਾਹਕ ਸਕ੍ਰਿਪਟਡ ਫਾਰਮੈਟ ਵਿੱਚ ਆਪਣੇ ਵੌਇਸ ਸਹਾਇਕਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦੇ ਜਾਂ ਸਵਾਲ ਪੁੱਛਦੇ ਸਮੇਂ ਸਹੀ ਸ਼ਬਦਾਂ ਜਾਂ ਵਾਕਾਂਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦੇ। ਇਸ ਲਈ ਵਿਸ਼ੇਸ਼ ਵੌਇਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਸਵੈਚਲਿਤ ਭਾਸ਼ਣ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਣੀ ਚਾਹੀਦੀ ਹੈ। ਉਦਾਹਰਨ ਲਈ, "ਸਭ ਤੋਂ ਨਜ਼ਦੀਕੀ ਹਸਪਤਾਲ ਕਿੱਥੇ ਸਥਿਤ ਹੈ?" “ਮੇਰੇ ਨੇੜੇ ਕੋਈ ਹਸਪਤਾਲ ਲੱਭੋ” ਜਾਂ “ਕੀ ਨੇੜੇ ਕੋਈ ਹਸਪਤਾਲ ਹੈ?” ਸਾਰੇ ਇੱਕੋ ਖੋਜ ਇਰਾਦੇ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ ਪਰ ਵੱਖੋ-ਵੱਖਰੇ ਢੰਗ ਨਾਲ ਵਰਣਿਤ ਹੁੰਦੇ ਹਨ।
ਸਮੱਸਿਆ
ਵਿਸ਼ਵਵਿਆਪੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਕਲਾਇੰਟਸ ਦੇ ਡਿਜੀਟਲ ਅਸਿਸਟੈਂਟ ਦੇ ਸਪੀਚ ਰੋਡਮੈਪ ਨੂੰ ਚਲਾਉਣ ਲਈ, ਟੀਮ ਨੂੰ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ AI ਮਾਡਲ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਲੋੜ ਸੀ। ਗਾਹਕ ਦੀਆਂ ਮਹੱਤਵਪੂਰਨ ਲੋੜਾਂ ਸਨ:
- 3 ਗਲੋਬਲ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬੋਲੀ ਪਛਾਣ ਸੇਵਾਵਾਂ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ (ਇਕੱਲੇ ਸਪੀਕਰ ਉਚਾਰਨ ਪ੍ਰੋਂਪਟ 30-13 ਸਕਿੰਟਾਂ ਤੋਂ ਵੱਧ ਨਹੀਂ) ਪ੍ਰਾਪਤ ਕਰੋ।
- ਹਰੇਕ ਭਾਸ਼ਾ ਲਈ, ਸਪਲਾਇਰ ਸਪੀਕਰਾਂ ਨੂੰ ਰਿਕਾਰਡ ਕਰਨ ਲਈ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ ਤਿਆਰ ਕਰੇਗਾ (ਜਦੋਂ ਤੱਕ ਕਿ
ਗਾਹਕ ਸਪਲਾਈ) ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਆਡੀਓ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰੋ। - ਸੰਬੰਧਿਤ JSON ਫਾਈਲਾਂ ਦੇ ਨਾਲ ਰਿਕਾਰਡ ਕੀਤੇ ਵਾਕਾਂਸ਼ਾਂ ਦਾ ਆਡੀਓ ਡੇਟਾ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰੋ
ਸਾਰੀਆਂ ਰਿਕਾਰਡਿੰਗਾਂ ਲਈ ਮੈਟਾਡੇਟਾ ਰੱਖਦਾ ਹੈ। - ਉਮਰ, ਲਿੰਗ, ਸਿੱਖਿਆ ਅਤੇ ਬੋਲੀ ਦੁਆਰਾ ਬੁਲਾਰਿਆਂ ਦੇ ਵਿਭਿੰਨ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ
- ਨਿਰਧਾਰਨ ਦੇ ਅਨੁਸਾਰ ਰਿਕਾਰਡਿੰਗ ਵਾਤਾਵਰਨ ਦੇ ਵਿਭਿੰਨ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ।
- ਹਰੇਕ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਘੱਟੋ-ਘੱਟ 16kHz ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਪਰ ਤਰਜੀਹੀ ਤੌਰ 'ਤੇ 44kHz ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ
“ਬਹੁਤ ਸਾਰੇ ਵਿਕਰੇਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਕਲਾਇੰਟ ਨੇ ਸ਼ੈਪ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਏਆਈ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਉਨ੍ਹਾਂ ਦੀ ਮੁਹਾਰਤ ਦੇ ਕਾਰਨ ਚੁਣਿਆ। ਅਸੀਂ ਸ਼ੇਪ ਦੀ ਪ੍ਰੋਜੈਕਟ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਯੋਗਤਾ, ਸਰੋਤ ਬਣਾਉਣ, ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਅਤੇ ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਤੋਂ ਲੋੜੀਂਦੇ ਵਾਕਾਂ ਨੂੰ 13 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਸਖ਼ਤ ਸਮਾਂ-ਸੀਮਾਵਾਂ ਦੇ ਅੰਦਰ ਅਤੇ ਲੋੜੀਂਦੀ ਗੁਣਵੱਤਾ ਦੇ ਨਾਲ ਪ੍ਰਦਾਨ ਕਰਨ ਵਿੱਚ ਉਨ੍ਹਾਂ ਦੀ ਮੁਹਾਰਤ ਤੋਂ ਪ੍ਰਭਾਵਿਤ ਹੋਏ।
ਦਾ ਹੱਲ
ਗੱਲਬਾਤ ਸੰਬੰਧੀ AI ਦੀ ਸਾਡੀ ਡੂੰਘੀ ਸਮਝ ਦੇ ਨਾਲ, ਅਸੀਂ ਕਲਾਇੰਟ ਨੂੰ ਉਹਨਾਂ ਦੇ AI-ਪਾਵਰਡ ਸਪੀਚ ਪ੍ਰੋਸੈਸਿੰਗ ਬਹੁ-ਭਾਸ਼ਾਈ ਵੌਇਸ ਸੂਟ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਵਿਆਖਿਆਕਾਰਾਂ ਦੀ ਇੱਕ ਟੀਮ ਨਾਲ ਡੇਟਾ ਨੂੰ ਇਕੱਤਰ ਕਰਨ, ਪ੍ਰਤੀਲਿਪੀ ਅਤੇ ਐਨੋਟੇਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।
ਸ਼ੈਪ ਲਈ ਕੰਮ ਦੇ ਦਾਇਰੇ ਵਿੱਚ ਬੋਲਣ ਦੀ ਪਛਾਣ ਲਈ ਆਡੀਓ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਪ੍ਰਾਪਤ ਕਰਨ, ਸਾਡੇ ਟੀਅਰ 1 ਅਤੇ ਟੀਅਰ 2 ਭਾਸ਼ਾ ਰੋਡਮੈਪ 'ਤੇ ਸਾਰੀਆਂ ਭਾਸ਼ਾਵਾਂ ਲਈ ਕਈ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗਾਂ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਕਰਨ, ਅਤੇ ਸੰਬੰਧਿਤ ਪ੍ਰਦਾਨ ਕਰਨ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਸੀ। JSON ਮੈਟਾਡੇਟਾ ਵਾਲੀਆਂ ਫਾਈਲਾਂ। ਸ਼ੈਪ ਨੇ ਗੁੰਝਲਦਾਰ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ML ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਗੁਣਵੱਤਾ ਦੇ ਲੋੜੀਂਦੇ ਪੱਧਰਾਂ ਨੂੰ ਕਾਇਮ ਰੱਖਦੇ ਹੋਏ ਪੈਮਾਨੇ 'ਤੇ 3-30 ਸਕਿੰਟਾਂ ਦੇ ਵਾਕ ਇਕੱਠੇ ਕੀਤੇ।
- ਆਡੀਓ ਇਕੱਤਰ ਕੀਤਾ, ਪ੍ਰਤੀਲਿਪੀ ਅਤੇ ਐਨੋਟੇਟਡ: 22,250 ਘੰਟੇ
- ਸਮਰਥਿਤ ਭਾਸ਼ਾਵਾਂ: 13 (ਡੈਨਿਸ਼, ਕੋਰੀਅਨ, ਸਾਊਦੀ ਅਰਬ ਅਰਬੀ, ਡੱਚ, ਮੇਨਲੈਂਡ ਅਤੇ ਤਾਈਵਾਨ ਚੀਨੀ, ਫ੍ਰੈਂਚ ਕੈਨੇਡੀਅਨ, ਮੈਕਸੀਕਨ ਸਪੈਨਿਸ਼, ਤੁਰਕੀ, ਹਿੰਦੀ, ਪੋਲਿਸ਼, ਜਾਪਾਨੀ, ਰੂਸੀ)
- ਵਾਕਾਂ ਦੀ ਸੰਖਿਆ: 7M +
- ਟਾਈਮਲਾਈਨ: 7-8 ਮਹੀਨੇ
16 kHz 'ਤੇ ਆਡੀਓ ਵਾਕਾਂ ਨੂੰ ਇਕੱਠਾ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਵਿਭਿੰਨ ਰਿਕਾਰਡਿੰਗ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਉਮਰ, ਲਿੰਗ, ਸਿੱਖਿਆ, ਅਤੇ ਉਪਭਾਸ਼ਾਵਾਂ ਦੁਆਰਾ ਬੁਲਾਰਿਆਂ ਦੇ ਇੱਕ ਸਿਹਤਮੰਦ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਇਆ।
ਪਰਿਣਾਮ
ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਦੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਕ ਆਡੀਓ ਡੇਟਾ ਨੇ ਕਲਾਇੰਟ ਨੂੰ 13 ਗਲੋਬਲ ਟੀਅਰ 1 ਅਤੇ 2 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਆਪਣੇ ਬਹੁ-ਭਾਸ਼ਾਈ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਸ਼ਕਤੀ ਦਿੱਤੀ। ਗੋਲਡ-ਸਟੈਂਡਰਡ ਟਰੇਨਿੰਗ ਡੇਟਾਸੇਟਸ ਦੇ ਨਾਲ, ਕਲਾਇੰਟ ਭਵਿੱਖ ਦੀਆਂ ਅਸਲ-ਸੰਸਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਬੁੱਧੀਮਾਨ ਅਤੇ ਮਜ਼ਬੂਤ ਡਿਜ਼ੀਟਲ ਸਹਾਇਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰ ਸਕਦਾ ਹੈ।
ਸਾਡੀ ਮਹਾਰਤ
ਸਿਫਾਰਸ਼ ਕੀਤੇ ਸਰੋਤ
ਖਰੀਦਦਾਰ ਦੀ ਗਾਈਡ
ਖਰੀਦਦਾਰ ਦੀ ਗਾਈਡ: ਗੱਲਬਾਤ ਸੰਬੰਧੀ ਏ.ਆਈ
ਜਿਸ ਚੈਟਬੋਟ ਨਾਲ ਤੁਸੀਂ ਗੱਲਬਾਤ ਕੀਤੀ ਹੈ, ਉਹ ਇੱਕ ਉੱਨਤ ਵਾਰਤਾਲਾਪ AI ਸਿਸਟਮ 'ਤੇ ਚੱਲਦਾ ਹੈ ਜੋ ਬਹੁਤ ਸਾਰੇ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ, ਪਰਖਿਆ, ਅਤੇ ਬਣਾਇਆ ਗਿਆ ਹੈ।
ਬਲੌਗ
ਗੱਲਬਾਤ ਦੀ ਸਥਿਤੀ AI 2021
ਕਨਵਰਸੇਸ਼ਨਲ AI 2021 ਇਨਫੋਗ੍ਰਾਫਿਕਸ ਇਸ ਬਾਰੇ ਗੱਲ ਕਰਦੇ ਹਨ ਕਿ ਗੱਲਬਾਤ AI ਕੀ ਹੈ, ਇਸਦਾ ਵਿਕਾਸ, ਕਿਸਮਾਂ, ਖੇਤਰ ਦੁਆਰਾ ਗੱਲਬਾਤ ਸੰਬੰਧੀ AI ਮਾਰਕੀਟ, ਵਰਤੋਂ ਦੇ ਕੇਸ, ਚੁਣੌਤੀਆਂ ਆਦਿ।
ਬਲੌਗ
3 ਵਾਰਤਾਲਾਪ AI ਦੇ ਵਿਕਾਸ ਲਈ ਰੁਕਾਵਟਾਂ
Shaip 50+ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਲੋੜੀਂਦੇ ਐਨੋਟੇਟਿਡ ਆਡੀਓ ਡੇਟਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਕੇ ਇੱਕ ਗਾਹਕ ਸ਼ਮੂਲੀਅਤ ਟੂਲ ਦੇ ਰੂਪ ਵਿੱਚ ਗੱਲਬਾਤ ਵਾਲੀ AI ਦੇ ਵਿਕਾਸ ਦੀ ਸ਼ੁਰੂਆਤ ਕਰ ਰਿਹਾ ਹੈ।
ਸਾਨੂੰ ਦੱਸੋ ਕਿ ਅਸੀਂ ਤੁਹਾਡੀ ਅਗਲੀ AI ਪਹਿਲ ਵਿੱਚ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦੇ ਹਾਂ.