ਕੇਸ ਸਟੱਡੀ: ਕਥਨ ਸੰਗ੍ਰਹਿ

7 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਹੁ-ਭਾਸ਼ਾਈ ਡਿਜੀਟਲ ਸਹਾਇਕ ਬਣਾਉਣ ਲਈ 13M+ ਉਚਾਰਣ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ

ਕਥਨ ਸੰਗ੍ਰਹਿ

ਅਸਲ ਸੰਸਾਰ ਹੱਲ

ਡਾਟਾ ਜੋ ਗਲੋਬਲ ਵਾਰਤਾਲਾਪ ਨੂੰ ਸ਼ਕਤੀ ਦਿੰਦਾ ਹੈ

ਉਚਾਰਣ ਸਿਖਲਾਈ ਦੀ ਲੋੜ ਇਸ ਲਈ ਪੈਦਾ ਹੁੰਦੀ ਹੈ ਕਿਉਂਕਿ ਸਾਰੇ ਗਾਹਕ ਸਕ੍ਰਿਪਟਡ ਫਾਰਮੈਟ ਵਿੱਚ ਆਪਣੇ ਵੌਇਸ ਸਹਾਇਕਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਦੇ ਜਾਂ ਸਵਾਲ ਪੁੱਛਦੇ ਸਮੇਂ ਸਹੀ ਸ਼ਬਦਾਂ ਜਾਂ ਵਾਕਾਂਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦੇ। ਇਸ ਲਈ ਵਿਸ਼ੇਸ਼ ਵੌਇਸ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਸਵੈਚਲਿਤ ਭਾਸ਼ਣ ਡੇਟਾ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਣੀ ਚਾਹੀਦੀ ਹੈ। ਉਦਾਹਰਨ ਲਈ, "ਸਭ ਤੋਂ ਨਜ਼ਦੀਕੀ ਹਸਪਤਾਲ ਕਿੱਥੇ ਸਥਿਤ ਹੈ?" “ਮੇਰੇ ਨੇੜੇ ਕੋਈ ਹਸਪਤਾਲ ਲੱਭੋ” ਜਾਂ “ਕੀ ਨੇੜੇ ਕੋਈ ਹਸਪਤਾਲ ਹੈ?” ਸਾਰੇ ਇੱਕੋ ਖੋਜ ਇਰਾਦੇ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ ਪਰ ਵੱਖੋ-ਵੱਖਰੇ ਢੰਗ ਨਾਲ ਵਰਣਿਤ ਹੁੰਦੇ ਹਨ।

ਕਥਨ ਸੰਗ੍ਰਹਿ ॥੧॥

ਸਮੱਸਿਆ

ਵਿਸ਼ਵਵਿਆਪੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਕਲਾਇੰਟਸ ਦੇ ਡਿਜੀਟਲ ਅਸਿਸਟੈਂਟ ਦੇ ਸਪੀਚ ਰੋਡਮੈਪ ਨੂੰ ਚਲਾਉਣ ਲਈ, ਟੀਮ ਨੂੰ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ AI ਮਾਡਲ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਲੋੜ ਸੀ। ਗਾਹਕ ਦੀਆਂ ਮਹੱਤਵਪੂਰਨ ਲੋੜਾਂ ਸਨ:

  • 3 ਗਲੋਬਲ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬੋਲੀ ਪਛਾਣ ਸੇਵਾਵਾਂ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ (ਇਕੱਲੇ ਸਪੀਕਰ ਉਚਾਰਨ ਪ੍ਰੋਂਪਟ 30-13 ਸਕਿੰਟਾਂ ਤੋਂ ਵੱਧ ਨਹੀਂ) ਪ੍ਰਾਪਤ ਕਰੋ।
  • ਹਰੇਕ ਭਾਸ਼ਾ ਲਈ, ਸਪਲਾਇਰ ਸਪੀਕਰਾਂ ਨੂੰ ਰਿਕਾਰਡ ਕਰਨ ਲਈ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ ਤਿਆਰ ਕਰੇਗਾ (ਜਦੋਂ ਤੱਕ ਕਿ
    ਗਾਹਕ ਸਪਲਾਈ) ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਆਡੀਓ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰੋ।
  • ਸੰਬੰਧਿਤ JSON ਫਾਈਲਾਂ ਦੇ ਨਾਲ ਰਿਕਾਰਡ ਕੀਤੇ ਵਾਕਾਂਸ਼ਾਂ ਦਾ ਆਡੀਓ ਡੇਟਾ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰੋ
    ਸਾਰੀਆਂ ਰਿਕਾਰਡਿੰਗਾਂ ਲਈ ਮੈਟਾਡੇਟਾ ਰੱਖਦਾ ਹੈ।
  • ਉਮਰ, ਲਿੰਗ, ਸਿੱਖਿਆ ਅਤੇ ਬੋਲੀ ਦੁਆਰਾ ਬੁਲਾਰਿਆਂ ਦੇ ਵਿਭਿੰਨ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ
  • ਨਿਰਧਾਰਨ ਦੇ ਅਨੁਸਾਰ ਰਿਕਾਰਡਿੰਗ ਵਾਤਾਵਰਨ ਦੇ ਵਿਭਿੰਨ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ।
  • ਹਰੇਕ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ ਘੱਟੋ-ਘੱਟ 16kHz ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਪਰ ਤਰਜੀਹੀ ਤੌਰ 'ਤੇ 44kHz ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ

ਆਪਣੀ ਗੱਲਬਾਤ AI ਨੂੰ ਤੇਜ਼ ਕਰੋ
100% ਦੁਆਰਾ ਐਪਲੀਕੇਸ਼ਨ ਵਿਕਾਸ

“ਬਹੁਤ ਸਾਰੇ ਵਿਕਰੇਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਕਲਾਇੰਟ ਨੇ ਸ਼ੈਪ ਨੂੰ ਗੱਲਬਾਤ ਦੇ ਏਆਈ ਪ੍ਰੋਜੈਕਟਾਂ ਵਿੱਚ ਉਨ੍ਹਾਂ ਦੀ ਮੁਹਾਰਤ ਦੇ ਕਾਰਨ ਚੁਣਿਆ। ਅਸੀਂ ਸ਼ੇਪ ਦੀ ਪ੍ਰੋਜੈਕਟ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਯੋਗਤਾ, ਸਰੋਤ ਬਣਾਉਣ, ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਅਤੇ ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਤੋਂ ਲੋੜੀਂਦੇ ਵਾਕਾਂ ਨੂੰ 13 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਸਖ਼ਤ ਸਮਾਂ-ਸੀਮਾਵਾਂ ਦੇ ਅੰਦਰ ਅਤੇ ਲੋੜੀਂਦੀ ਗੁਣਵੱਤਾ ਦੇ ਨਾਲ ਪ੍ਰਦਾਨ ਕਰਨ ਵਿੱਚ ਉਨ੍ਹਾਂ ਦੀ ਮੁਹਾਰਤ ਤੋਂ ਪ੍ਰਭਾਵਿਤ ਹੋਏ।

ਦਾ ਹੱਲ

ਗੱਲਬਾਤ ਸੰਬੰਧੀ AI ਦੀ ਸਾਡੀ ਡੂੰਘੀ ਸਮਝ ਦੇ ਨਾਲ, ਅਸੀਂ ਕਲਾਇੰਟ ਨੂੰ ਉਹਨਾਂ ਦੇ AI-ਪਾਵਰਡ ਸਪੀਚ ਪ੍ਰੋਸੈਸਿੰਗ ਬਹੁ-ਭਾਸ਼ਾਈ ਵੌਇਸ ਸੂਟ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਵਿਆਖਿਆਕਾਰਾਂ ਦੀ ਇੱਕ ਟੀਮ ਨਾਲ ਡੇਟਾ ਨੂੰ ਇਕੱਤਰ ਕਰਨ, ਪ੍ਰਤੀਲਿਪੀ ਅਤੇ ਐਨੋਟੇਟ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।

ਸ਼ੈਪ ਲਈ ਕੰਮ ਦੇ ਦਾਇਰੇ ਵਿੱਚ ਬੋਲਣ ਦੀ ਪਛਾਣ ਲਈ ਆਡੀਓ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਪ੍ਰਾਪਤ ਕਰਨ, ਸਾਡੇ ਟੀਅਰ 1 ਅਤੇ ਟੀਅਰ 2 ਭਾਸ਼ਾ ਰੋਡਮੈਪ 'ਤੇ ਸਾਰੀਆਂ ਭਾਸ਼ਾਵਾਂ ਲਈ ਕਈ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗਾਂ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਕਰਨ, ਅਤੇ ਸੰਬੰਧਿਤ ਪ੍ਰਦਾਨ ਕਰਨ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਸੀ। JSON ਮੈਟਾਡੇਟਾ ਵਾਲੀਆਂ ਫਾਈਲਾਂ। ਸ਼ੈਪ ਨੇ ਗੁੰਝਲਦਾਰ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ML ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਗੁਣਵੱਤਾ ਦੇ ਲੋੜੀਂਦੇ ਪੱਧਰਾਂ ਨੂੰ ਕਾਇਮ ਰੱਖਦੇ ਹੋਏ ਪੈਮਾਨੇ 'ਤੇ 3-30 ਸਕਿੰਟਾਂ ਦੇ ਵਾਕ ਇਕੱਠੇ ਕੀਤੇ।

  • ਆਡੀਓ ਇਕੱਤਰ ਕੀਤਾ, ਪ੍ਰਤੀਲਿਪੀ ਅਤੇ ਐਨੋਟੇਟਡ: 22,250 ਘੰਟੇ
  • ਸਮਰਥਿਤ ਭਾਸ਼ਾਵਾਂ: 13 (ਡੈਨਿਸ਼, ਕੋਰੀਅਨ, ਸਾਊਦੀ ਅਰਬ ਅਰਬੀ, ਡੱਚ, ਮੇਨਲੈਂਡ ਅਤੇ ਤਾਈਵਾਨ ਚੀਨੀ, ਫ੍ਰੈਂਚ ਕੈਨੇਡੀਅਨ, ਮੈਕਸੀਕਨ ਸਪੈਨਿਸ਼, ਤੁਰਕੀ, ਹਿੰਦੀ, ਪੋਲਿਸ਼, ਜਾਪਾਨੀ, ਰੂਸੀ)
  • ਵਾਕਾਂ ਦੀ ਸੰਖਿਆ: 7M +
  • ਟਾਈਮਲਾਈਨ: 7-8 ਮਹੀਨੇ

ਏਆਈ-ਪਾਵਰਡ ਸਪੀਚ ਪ੍ਰੋਸੈਸਿੰਗ ਬਹੁ-ਭਾਸ਼ਾਈ ਵੌਇਸ ਸੂਟ

16 kHz 'ਤੇ ਆਡੀਓ ਵਾਕਾਂ ਨੂੰ ਇਕੱਠਾ ਕਰਦੇ ਹੋਏ, ਅਸੀਂ ਵਿਭਿੰਨ ਰਿਕਾਰਡਿੰਗ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਉਮਰ, ਲਿੰਗ, ਸਿੱਖਿਆ, ਅਤੇ ਉਪਭਾਸ਼ਾਵਾਂ ਦੁਆਰਾ ਬੁਲਾਰਿਆਂ ਦੇ ਇੱਕ ਸਿਹਤਮੰਦ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਇਆ।

ਪਰਿਣਾਮ

ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਦੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਕ ਆਡੀਓ ਡੇਟਾ ਨੇ ਕਲਾਇੰਟ ਨੂੰ 13 ਗਲੋਬਲ ਟੀਅਰ 1 ਅਤੇ 2 ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਆਪਣੇ ਬਹੁ-ਭਾਸ਼ਾਈ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਸ਼ਕਤੀ ਦਿੱਤੀ। ਗੋਲਡ-ਸਟੈਂਡਰਡ ਟਰੇਨਿੰਗ ਡੇਟਾਸੇਟਸ ਦੇ ਨਾਲ, ਕਲਾਇੰਟ ਭਵਿੱਖ ਦੀਆਂ ਅਸਲ-ਸੰਸਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਬੁੱਧੀਮਾਨ ਅਤੇ ਮਜ਼ਬੂਤ ​​​​ਡਿਜ਼ੀਟਲ ਸਹਾਇਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰ ਸਕਦਾ ਹੈ।

ਉੱਚ-ਗੁਣਵੱਤਾ ਕਥਨ ਆਡੀਓ ਡਾਟਾ

ਸਾਡੀ ਮਹਾਰਤ

ਭਾਸ਼ਣ ਦੇ ਘੰਟੇ ਇਕੱਠੇ ਕੀਤੇ
0 +
ਵੌਇਸ ਡਾਟਾ ਕੁਲੈਕਟਰਾਂ ਦੀ ਟੀਮ
0
PII ਅਨੁਕੂਲ
0 %
ਠੰਡਾ ਨੰਬਰ
0 +
ਡੇਟਾ ਸਵੀਕ੍ਰਿਤੀ ਅਤੇ ਸ਼ੁੱਧਤਾ
> 0
ਫਾਰਚੂਨ 500 ਗਾਹਕ
0 +

ਸਾਨੂੰ ਦੱਸੋ ਕਿ ਅਸੀਂ ਤੁਹਾਡੀ ਅਗਲੀ AI ਪਹਿਲ ਵਿੱਚ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦੇ ਹਾਂ.