ਗੱਲਬਾਤ ਸੰਬੰਧੀ AI: ਆਟੋਮੈਟਿਕ ਸਪੀਚ ਰਿਕੋਗਨੀਸ਼ਨ

8k ਤੋਂ ਵੱਧ ਔਡੀਓ ਘੰਟੇ ਇਕੱਠੇ ਕੀਤੇ ਗਏ, ਬਹੁ-ਭਾਸ਼ਾਈ ਵੌਇਸ ਤਕਨਾਲੋਜੀ ਲਈ 800 ਘੰਟੇ ਪ੍ਰਤੀਲਿਪੀ ਕੀਤੇ ਗਏ

ਗੱਲਬਾਤ ਏ.ਆਈ

ਜਾਣ-ਪਛਾਣ

ਭਾਰਤ ਨੂੰ ਇੱਕ ਅਜਿਹੇ ਪਲੇਟਫਾਰਮ ਦੀ ਲੋੜ ਸੀ ਜੋ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਡਿਜੀਟਲ ਸੇਵਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਬਹੁ-ਭਾਸ਼ਾਈ ਡੇਟਾਸੇਟਸ ਅਤੇ ਏਆਈ-ਅਧਾਰਤ ਭਾਸ਼ਾ ਤਕਨਾਲੋਜੀ ਹੱਲਾਂ ਨੂੰ ਬਣਾਉਣ 'ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਿਤ ਕਰੇ। ਇਸ ਪਹਿਲਕਦਮੀ ਨੂੰ ਸ਼ੁਰੂ ਕਰਨ ਲਈ, ਕਲਾਇੰਟ ਨੇ ਬਹੁ-ਭਾਸ਼ਾਈ ਭਾਸ਼ਣ ਮਾਡਲ ਬਣਾਉਣ ਲਈ ਭਾਰਤੀ ਭਾਸ਼ਾ ਨੂੰ ਇਕੱਠਾ ਕਰਨ, ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਲਈ ਸ਼ੈਪ ਨਾਲ ਸਾਂਝੇਦਾਰੀ ਕੀਤੀ।

ਵਾਲੀਅਮ

ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਡੇਟਾ ਦੇ ਘੰਟੇ
10
ਐਨੋਟੇਟ ਕੀਤੇ ਪੰਨਿਆਂ ਦੀ ਸੰਖਿਆ
10 +
ਪ੍ਰੋਜੈਕਟ ਦੀ ਮਿਆਦ
< 1 ਮਹੀਨੇ

ਚੁਣੌਤੀ

ਕਲਾਇੰਟ ਦੀ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਪੀਚ ਟੈਕਨਾਲੋਜੀ ਸਪੀਚ ਰੋਡਮੈਪ ਵਿੱਚ ਸਹਾਇਤਾ ਕਰਨ ਲਈ, ਟੀਮ ਨੂੰ AI ਮਾਡਲ ਬਣਾਉਣ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਿਖਲਾਈ ਡੇਟਾ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ, ਵੰਡਣ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਦੀ ਲੋੜ ਸੀ। ਗਾਹਕ ਦੀਆਂ ਮਹੱਤਵਪੂਰਨ ਲੋੜਾਂ ਸਨ:

ਡਾਟਾ ਇਕੱਤਰ ਕਰਨਾ

  • ਭਾਰਤ ਦੇ ਦੂਰ-ਦੁਰਾਡੇ ਦੇ ਸਥਾਨਾਂ ਤੋਂ 8000 ਘੰਟਿਆਂ ਦਾ ਸਿਖਲਾਈ ਡੇਟਾ ਪ੍ਰਾਪਤ ਕਰੋ
  • ਸਪਲਾਇਰ 20-70 ਸਾਲ ਦੇ ਉਮਰ ਸਮੂਹਾਂ ਤੋਂ ਸਵੈ-ਚਾਲਤ ਭਾਸ਼ਣ ਇਕੱਤਰ ਕਰਨ ਲਈ
  • ਉਮਰ, ਲਿੰਗ, ਸਿੱਖਿਆ ਅਤੇ ਉਪਭਾਸ਼ਾਵਾਂ ਦੁਆਰਾ ਬੁਲਾਰਿਆਂ ਦੇ ਵਿਭਿੰਨ ਮਿਸ਼ਰਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ
  • ਹਰੇਕ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗ 16 ਬਿੱਟ/ਨਮੂਨੇ ਦੇ ਨਾਲ ਘੱਟੋ-ਘੱਟ 16kHz ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।
ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ

ਡਾਟਾ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ

ਅੱਖਰਾਂ ਅਤੇ ਵਿਸ਼ੇਸ਼ ਚਿੰਨ੍ਹਾਂ, ਸਪੈਲਿੰਗ ਅਤੇ ਵਿਆਕਰਨ, ਕੈਪੀਟਲਾਈਜ਼ੇਸ਼ਨ, ਸੰਖੇਪ, ਸੰਕੁਚਨ, ਵਿਅਕਤੀਗਤ ਬੋਲੇ ​​ਜਾਣ ਵਾਲੇ ਅੱਖਰ, ਸੰਖਿਆਵਾਂ, ਵਿਰਾਮ ਚਿੰਨ੍ਹਾਂ, ਸੰਖੇਪ ਸ਼ਬਦਾਂ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਸ਼ਬਦਾਂ, ਅਸਪਸ਼ਟ ਭਾਸ਼ਣ, ਅਣ-ਸਮਝੀ ਬੋਲੀ, ਗੈਰ-ਨਿਸ਼ਾਨਾ, ਭਾਸ਼ਾਵਾਂ ਦੇ ਆਲੇ ਦੁਆਲੇ ਵੇਰਵਿਆਂ ਪ੍ਰਤੀਲਿਪੀ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰੋ।

ਡਾਟਾ ਪ੍ਰਤੀਲਿਪੀ

ਗੁਣਵੱਤਾ ਜਾਂਚ ਅਤੇ ਫੀਡਬੈਕ

ਸਾਰੀਆਂ ਰਿਕਾਰਡਿੰਗਾਂ ਨੂੰ ਗੁਣਵੱਤਾ ਦੇ ਮੁਲਾਂਕਣ ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਤੋਂ ਗੁਜ਼ਰਨਾ ਹੈ, ਸਿਰਫ ਪ੍ਰਮਾਣਿਤ ਭਾਸ਼ਣ ਰਿਕਾਰਡਿੰਗਾਂ ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਜਾਣੀਆਂ ਹਨ

ਦਾ ਹੱਲ

ਗੱਲਬਾਤ ਸੰਬੰਧੀ AI ਦੀ ਸਾਡੀ ਡੂੰਘੀ ਸਮਝ ਦੇ ਨਾਲ, ਅਸੀਂ ਕਲਾਇੰਟ ਨੂੰ ਭਾਰਤ ਦੇ ਦੂਰ-ਦੁਰਾਡੇ ਦੇ ਹਿੱਸਿਆਂ ਤੋਂ ਆਡੀਓ ਡੇਟਾ ਦਾ ਵੱਡਾ ਭੰਡਾਰ ਬਣਾਉਣ ਲਈ ਮਾਹਰ ਕੁਲੈਕਟਰਾਂ, ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਅਤੇ ਵਿਆਖਿਆਕਾਰਾਂ ਦੀ ਇੱਕ ਟੀਮ ਨਾਲ ਆਡੀਓ ਡੇਟਾ ਨੂੰ ਇਕੱਤਰ ਕਰਨ, ਪ੍ਰਤੀਲਿਪੀ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।

ਸ਼ੈਪ ਲਈ ਕੰਮ ਦੇ ਦਾਇਰੇ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਸੀ ਪਰ ਆਡੀਓ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਪ੍ਰਾਪਤ ਕਰਨ, ਡੇਟਾ ਨੂੰ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬ ਕਰਨ ਅਤੇ ਮੈਟਾਡੇਟਾ [ਸਪੀਕਰਾਂ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਾਈਟਰਾਂ ਦੋਵਾਂ ਲਈ] ਨਾਲ ਸੰਬੰਧਿਤ JSON ਫਾਈਲਾਂ ਪ੍ਰਦਾਨ ਕਰਨ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਸੀ। ਹਰੇਕ ਸਪੀਕਰ ਲਈ, ਮੈਟਾਡੇਟਾ ਵਿੱਚ ਇੱਕ ਅਗਿਆਤ ਸਪੀਕਰ ID, ਡਿਵਾਈਸ ਵੇਰਵੇ, ਜਨਸੰਖਿਆ ਜਾਣਕਾਰੀ ਜਿਵੇਂ ਕਿ ਲਿੰਗ, ਉਮਰ, ਅਤੇ ਸਿੱਖਿਆ, ਉਹਨਾਂ ਦੇ ਪਿਨਕੋਡ, ਸਮਾਜਿਕ-ਆਰਥਿਕ ਸਥਿਤੀ, ਬੋਲੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਭਾਸ਼ਾਵਾਂ, ਅਤੇ ਉਹਨਾਂ ਦੇ ਜੀਵਨ ਦੇ ਰਹਿਣ ਦੀ ਮਿਆਦ ਦਾ ਰਿਕਾਰਡ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਹਰੇਕ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬਰ ਲਈ, ਡੇਟਾ ਵਿੱਚ ਇੱਕ ਗੁਮਨਾਮ ਟ੍ਰਾਂਸਕ੍ਰਾਈਬਰ ਆਈਡੀ, ਸਪੀਕਰਾਂ ਦੇ ਸਮਾਨ ਜਨਸੰਖਿਆ ਵੇਰਵੇ, ਉਹਨਾਂ ਦੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਅਨੁਭਵ ਦੀ ਮਿਆਦ, ਅਤੇ ਉਹਨਾਂ ਭਾਸ਼ਾਵਾਂ ਦਾ ਇੱਕ ਪੂਰਾ ਵਿਭਾਜਨ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਜੋ ਉਹ ਪੜ੍ਹ, ਲਿਖ ਅਤੇ ਬੋਲ ਸਕਦੇ ਹਨ।

ਸ਼ੈਪ ਇਕੱਠਾ ਕੀਤਾ 8000 ਗੁੰਝਲਦਾਰ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਸਪੀਚ ਟੈਕਨਾਲੋਜੀ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਗੁਣਵੱਤਾ ਦੇ ਲੋੜੀਂਦੇ ਪੱਧਰਾਂ ਨੂੰ ਕਾਇਮ ਰੱਖਦੇ ਹੋਏ ਪੈਮਾਨੇ 'ਤੇ ਔਡੀਓ ਡੇਟਾ / ਸਵੈਚਲਿਤ ਭਾਸ਼ਣ ਦੇ ਘੰਟੇ ਅਤੇ 800 ਘੰਟੇ ਪ੍ਰਤੀਲਿਪੀ. ਹਰੇਕ ਭਾਗੀਦਾਰ ਤੋਂ ਸਪੱਸ਼ਟ ਸਹਿਮਤੀ ਫਾਰਮ ਲਿਆ ਗਿਆ ਸੀ। ਇਕੱਠਾ ਕੀਤਾ ਗਿਆ/ਸਪੌਂਟੇਨੀਅਸ ਭਾਸ਼ਣ ਯੂਨੀਵਰਸਿਟੀ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਚਿੱਤਰਾਂ 'ਤੇ ਅਧਾਰਤ ਸੀ। ਦੇ 3500 ਤਸਵੀਰ 1000 ਆਮ ਹਨ ਅਤੇ 2500 ਜ਼ਿਲ੍ਹਾ-ਵਿਸ਼ੇਸ਼ ਸੱਭਿਆਚਾਰ, ਤਿਉਹਾਰਾਂ, ਆਦਿ ਨਾਲ ਸਬੰਧਤ। ਚਿੱਤਰ ਵੱਖ-ਵੱਖ ਡੋਮੇਨਾਂ ਜਿਵੇਂ ਕਿ ਰੇਲਵੇ ਸਟੇਸ਼ਨ, ਬਾਜ਼ਾਰ, ਮੌਸਮ ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।

ਡਾਟਾ ਇਕੱਤਰ ਕਰਨਾ

ਰਾਜਜ਼ਿਲ੍ਹੇਆਡੀਓ ਘੰਟੇਪ੍ਰਤਿਲਿਪੀ
(ਘੰਟੇ)
ਬਿਹਾਰਸਰਨ, ਪੂਰਬੀ ਚੰਪਾਰਣ, ਗੋਪਾਲਗੰਜ, ਸੀਤਾਮੜੀ, ਸਮਸਤੀਪੁਰ, ਦਰਭੰਗਾ, ਮਧੇਪੁਰਾ, ਭਾਗਲਪੁਰ, ਗਯਾ, ਕਿਸ਼ਨਗੰਜ, ਵੈਸ਼ਾਲੀ, ਲਖੀਸਰਾਏ, ਸਹਰਸਾ, ਸੁਪੌਲ, ਅਰਰੀਆ, ਬੇਗੂਸਰਾਏ, ਜਹਾਨਾਬਾਦ, ਪੂਰਨੀਆ, ਮੁਜ਼ੱਫਰਪੁਰ, ਜਮੁਈ2000200
ਉੱਤਰ ਪ੍ਰਦੇਸ਼ਦੇਵਰੀਆ, ਵਾਰਾਣਸੀ, ਗੋਰਖਪੁਰ, ਗਾਜ਼ੀਪੁਰ, ਮੁਜ਼ੱਫਰਨਗਰ, ਏਟਾ, ਹਮੀਰਪੁਰ, ਜੋਤੀਬਾ ਫੂਲੇ ਨਗਰ, ਬੁਡੌਨ, ਜਾਲੌਨ1000100
ਰਾਜਸਥਾਨਨਾਗੌਰ, ਚੁਰੂ20020
ਉਤਰਾਖੰਡਟਿਹਰੀ ਗੜ੍ਹਵਾਲ, ਉੱਤਰਕਾਸ਼ੀ20020
ਛੱਤੀਸਗੜ੍ਹਬਿਲਾਸਪੁਰ, ਰਾਏਗੜ੍ਹ, ਕਬੀਰਧਾਮ, ਸਰਗੁਜਾ, ਕੋਰਬਾ, ਜਸ਼ਪੁਰ, ਰਾਜਨੰਦਗਾਂਵ, ਬਲਰਾਮਪੁਰ, ਬਸਤਰ, ਸੁਕਮਾ1000100
ਪੱਛਮੀ ਬੰਗਾਲਪੱਛਮ ਮੇਦਿਨੀਪੁਰ, ਮਾਲਦਾ, ਜਲਪਾਈਗੁੜੀ, ਪੁਰੂਲੀਆ, ਕੋਲਕਾਤਾ, ਝਾਰਗ੍ਰਾਮ, ਉੱਤਰੀ 24 ਪਰਗਨਾ, ਦੱਖਣ ਦੀਨਾਜਪੁਰ80080
ਝਾਰਖੰਡਸਾਹਿਬਗੰਜ, ਜਾਮਤਾਰਾ20020
APਗੁੰਟੂਰ, ਚਿਤੂਰ, ਵਿਸ਼ਾਖਾਪਟਨਮ, ਕ੍ਰਿਸ਼ਨਾ, ਅਨੰਤਪੁਰ, ਸ਼੍ਰੀਕਾਕੁਲਮ60060
ਤੇਲੰਗਾਨਾਕਰੀਮਨਗਰ, ਨਲਗੋਂਡਾ20020
ਗੋਆਉੱਤਰ+ਦੱਖਣੀ ਗੋਆ10010
ਕਰਨਾਟਕਦੱਖਣ ਕੰਨੜ, ਗੁਲਬਰਗਾ, ਧਾਰਵਾੜ, ਬੇਲਾਰੀ, ਮੈਸੂਰ, ਸ਼ਿਮੋਗਾ, ਬੀਜਾਪੁਰ, ਬੇਲਗਾਮ, ਰਾਏਚੂਰ, ਚਾਮਰਾਜਨਗਰ1000100
ਮਹਾਰਾਸ਼ਟਰਸਿੰਧੂਦੁਰਗ, ਧੂਲੇ, ਨਾਗਪੁਰ, ਪੁਣੇ, ਔਰੰਗਾਬਾਦ, ਚੰਦਰਪੁਰ, ਸੋਲਾਪੁਰ70070
ਕੁੱਲ8000800

ਜਨਰਲ ਗਾਈਡਲਾਈਨਜ਼

ਫਾਰਮੈਟ ਹੈ

    • 16 kHz 'ਤੇ ਆਡੀਓ, 16 ਬਿੱਟ/ਨਮੂਨਾ।
    • ਸਿੰਗਲ ਚੈਨਲ।
    • ਟ੍ਰਾਂਸਕੋਡਿੰਗ ਤੋਂ ਬਿਨਾਂ ਕੱਚਾ ਆਡੀਓ।

ਸ਼ੈਲੀ

    • ਸੁਭਾਵਿਕ ਭਾਸ਼ਣ.
    • ਯੂਨੀਵਰਸਿਟੀ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਚਿੱਤਰਾਂ 'ਤੇ ਆਧਾਰਿਤ ਵਾਕ। 3500 ਚਿੱਤਰਾਂ ਵਿੱਚੋਂ, 1000 ਆਮ ਹਨ ਅਤੇ 2500 ਜ਼ਿਲ੍ਹਾ-ਵਿਸ਼ੇਸ਼ ਸੱਭਿਆਚਾਰ, ਤਿਉਹਾਰਾਂ ਆਦਿ ਨਾਲ ਸਬੰਧਤ ਹਨ। ਚਿੱਤਰ ਵੱਖ-ਵੱਖ ਡੋਮੇਨਾਂ ਜਿਵੇਂ ਕਿ ਰੇਲਵੇ ਸਟੇਸ਼ਨ, ਬਾਜ਼ਾਰ, ਮੌਸਮ ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ।

ਰਿਕਾਰਡਿੰਗ ਬੈਕਗ੍ਰਾਊਂਡ

    • ਇੱਕ ਸ਼ਾਂਤ, ਗੂੰਜ-ਮੁਕਤ ਵਾਤਾਵਰਣ ਵਿੱਚ ਰਿਕਾਰਡ ਕੀਤਾ ਗਿਆ।
    • ਰਿਕਾਰਡਿੰਗ ਦੇ ਦੌਰਾਨ ਕੋਈ ਸਮਾਰਟਫੋਨ ਗੜਬੜੀ (ਵਾਈਬ੍ਰੇਸ਼ਨ ਜਾਂ ਸੂਚਨਾਵਾਂ) ਨਹੀਂ।
    • ਕਲਿੱਪਿੰਗ ਜਾਂ ਦੂਰ-ਖੇਤਰ ਦੇ ਪ੍ਰਭਾਵਾਂ ਵਰਗੀਆਂ ਕੋਈ ਵਿਗਾੜ ਨਹੀਂ।
    • ਫ਼ੋਨ ਤੋਂ ਵਾਈਬ੍ਰੇਸ਼ਨ ਅਸਵੀਕਾਰਨਯੋਗ; ਜੇਕਰ ਆਡੀਓ ਸਾਫ਼ ਹੋਵੇ ਤਾਂ ਬਾਹਰੀ ਵਾਈਬ੍ਰੇਸ਼ਨਾਂ ਸਹਿਣਯੋਗ ਹੁੰਦੀਆਂ ਹਨ।

ਸਪੀਕਰ ਦਾ ਵੇਰਵਾ

    • ਪ੍ਰਤੀ ਜ਼ਿਲ੍ਹਾ ਸੰਤੁਲਿਤ ਲਿੰਗ ਵੰਡ ਦੇ ਨਾਲ ਉਮਰ ਦੀ ਰੇਂਜ 20-70 ਸਾਲ।
    • ਹਰੇਕ ਜ਼ਿਲ੍ਹੇ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ 400 ਮੂਲ ਬੋਲਣ ਵਾਲੇ।
    • ਬੋਲਣ ਵਾਲਿਆਂ ਨੂੰ ਆਪਣੀ ਘਰੇਲੂ ਭਾਸ਼ਾ/ਬੋਲੀ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ।
    • ਸਾਰੇ ਭਾਗੀਦਾਰਾਂ ਲਈ ਸਹਿਮਤੀ ਫਾਰਮ ਲਾਜ਼ਮੀ ਹਨ।


ਗੁਣਵੱਤਾ ਜਾਂਚ ਅਤੇ ਨਾਜ਼ੁਕ ਗੁਣਵੱਤਾ ਭਰੋਸਾ

QA ਪ੍ਰਕਿਰਿਆ ਆਡੀਓ ਰਿਕਾਰਡਿੰਗਾਂ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨਾਂ ਲਈ ਗੁਣਵੱਤਾ ਭਰੋਸੇ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੀ ਹੈ। ਆਡੀਓ ਮਿਆਰ ਸਟੀਕ ਚੁੱਪ, ਖੰਡ ਦੀ ਮਿਆਦ, ਸਿੰਗਲ-ਸਪੀਕਰ ਸਪਸ਼ਟਤਾ, ਅਤੇ ਉਮਰ ਅਤੇ ਸਮਾਜਿਕ-ਆਰਥਿਕ ਸਥਿਤੀ ਸਮੇਤ ਵਿਸਤ੍ਰਿਤ ਮੈਟਾਡੇਟਾ 'ਤੇ ਕੇਂਦ੍ਰਤ ਕਰਦੇ ਹਨ। ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਮਾਪਦੰਡ ਟੈਗ ਦੀ ਸ਼ੁੱਧਤਾ, ਸ਼ਬਦ ਦੀ ਸੱਚਾਈ, ਅਤੇ ਸਹੀ ਹਿੱਸੇ ਦੇ ਵੇਰਵਿਆਂ 'ਤੇ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ। ਸਵੀਕ੍ਰਿਤੀ ਬੈਂਚਮਾਰਕ ਇਹ ਹੁਕਮ ਦਿੰਦਾ ਹੈ ਕਿ ਜੇਕਰ ਔਡੀਓ ਬੈਚ ਦੇ 20% ਤੋਂ ਵੱਧ ਇਹਨਾਂ ਮਿਆਰਾਂ ਵਿੱਚ ਅਸਫਲ ਰਹਿੰਦੇ ਹਨ, ਤਾਂ ਇਸਨੂੰ ਰੱਦ ਕਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। 20% ਤੋਂ ਘੱਟ ਮਤਭੇਦਾਂ ਲਈ, ਸਮਾਨ ਪ੍ਰੋਫਾਈਲਾਂ ਨਾਲ ਰਿਕਾਰਡਿੰਗ ਬਦਲਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਡਾਟਾ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ

ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਸ਼ੁੱਧਤਾ ਅਤੇ ਜ਼ੁਬਾਨੀ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ 'ਤੇ ਸਿਰਫ਼ ਉਦੋਂ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ ਜਦੋਂ ਸ਼ਬਦ ਸਪੱਸ਼ਟ ਅਤੇ ਸਮਝਣ ਯੋਗ ਹੁੰਦੇ ਹਨ; ਮੁੱਦੇ ਦੇ ਆਧਾਰ 'ਤੇ ਅਸਪਸ਼ਟ ਸ਼ਬਦਾਂ ਨੂੰ [ਅਣਸਮਝਣਯੋਗ] ਜਾਂ [ਅਣਸੁਣਨਯੋਗ] ਵਜੋਂ ਚਿੰਨ੍ਹਿਤ ਕੀਤਾ ਗਿਆ ਹੈ। ਲੰਬੇ ਆਡੀਓ ਵਿੱਚ ਵਾਕ ਸੀਮਾਵਾਂ ਨਾਲ ਚਿੰਨ੍ਹਿਤ ਕੀਤਾ ਗਿਆ ਹੈ , ਅਤੇ ਵਿਆਕਰਣ ਦੀਆਂ ਗਲਤੀਆਂ ਦੀ ਕੋਈ ਵਿਆਖਿਆ ਜਾਂ ਸੁਧਾਰ ਦੀ ਆਗਿਆ ਨਹੀਂ ਹੈ। ਵਰਬੈਟਿਮ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਵਿੱਚ ਗਲਤੀਆਂ, ਗਾਲਾਂ, ਅਤੇ ਦੁਹਰਾਓ ਸ਼ਾਮਲ ਹਨ ਪਰ ਗਲਤ ਸ਼ੁਰੂਆਤ, ਫਿਲਰ ਧੁਨੀਆਂ ਅਤੇ ਸਟਟਰਾਂ ਨੂੰ ਛੱਡ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। ਬੈਕਗ੍ਰਾਉਂਡ ਅਤੇ ਫੋਰਗਰਾਉਂਡ ਸ਼ੋਰ ਨੂੰ ਵਰਣਨਯੋਗ ਟੈਗਸ ਨਾਲ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਸਹੀ ਨਾਮ, ਸਿਰਲੇਖ ਅਤੇ ਨੰਬਰ ਖਾਸ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਨਿਯਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਹਰ ਵਾਕ ਲਈ ਸਪੀਕਰ ਲੇਬਲ ਵਰਤੇ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਅਧੂਰੇ ਵਾਕਾਂ ਨਾਲ ਦਰਸਾਏ ਜਾਂਦੇ ਹਨ।

ਪ੍ਰੋਜੈਕਟ ਵਰਕਫਲੋ

ਵਰਕਫਲੋ ਆਡੀਓ ਪ੍ਰਤੀਲਿਪੀ ਪ੍ਰਕਿਰਿਆ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ। ਇਹ ਆਨਬੋਰਡਿੰਗ ਅਤੇ ਸਿਖਲਾਈ ਭਾਗੀਦਾਰਾਂ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ। ਉਹ ਇੱਕ ਐਪ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਡੀਓ ਰਿਕਾਰਡ ਕਰਦੇ ਹਨ, ਜੋ ਕਿ QA ਪਲੇਟਫਾਰਮ 'ਤੇ ਅੱਪਲੋਡ ਹੁੰਦਾ ਹੈ। ਇਹ ਆਡੀਓ ਗੁਣਵੱਤਾ ਜਾਂਚਾਂ ਅਤੇ ਆਟੋਮੈਟਿਕ ਸੈਗਮੈਂਟੇਸ਼ਨ ਤੋਂ ਗੁਜ਼ਰਦਾ ਹੈ। ਤਕਨੀਕੀ ਟੀਮ ਫਿਰ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਲਈ ਹਿੱਸੇ ਤਿਆਰ ਕਰਦੀ ਹੈ। ਮੈਨੂਅਲ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਤੋਂ ਬਾਅਦ, ਇੱਕ ਗੁਣਵੱਤਾ ਭਰੋਸਾ ਕਦਮ ਹੈ। ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਗਾਹਕ ਨੂੰ ਡਿਲੀਵਰ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਜੇਕਰ ਸਵੀਕਾਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਡਿਲੀਵਰੀ ਨੂੰ ਪੂਰਾ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ। ਜੇਕਰ ਨਹੀਂ, ਤਾਂ ਗਾਹਕ ਫੀਡਬੈਕ ਦੇ ਆਧਾਰ 'ਤੇ ਸੰਸ਼ੋਧਨ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।

ਨਤੀਜਾ

ਮਾਹਰ ਭਾਸ਼ਾ ਵਿਗਿਆਨੀਆਂ ਦਾ ਉੱਚ-ਗੁਣਵੱਤਾ ਆਡੀਓ ਡੇਟਾ ਸਾਡੇ ਕਲਾਇੰਟ ਨੂੰ ਨਿਰਧਾਰਤ ਸਮੇਂ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਬਹੁ-ਭਾਸ਼ਾਈ ਭਾਸ਼ਣ ਪਛਾਣ ਮਾਡਲਾਂ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਅਤੇ ਬਣਾਉਣ ਵਿੱਚ ਸਮਰੱਥ ਕਰੇਗਾ। ਸਪੀਚ ਮਾਨਤਾ ਮਾਡਲਾਂ ਨੂੰ ਇਹਨਾਂ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ:

  • ਨਾਗਰਿਕਾਂ ਨੂੰ ਉਨ੍ਹਾਂ ਦੀ ਆਪਣੀ ਮਾਤ ਭਾਸ਼ਾ ਵਿੱਚ ਪਹਿਲਕਦਮੀਆਂ ਨਾਲ ਜੋੜ ਕੇ ਡਿਜੀਟਲ ਸ਼ਮੂਲੀਅਤ ਲਈ ਭਾਸ਼ਾ ਦੀ ਰੁਕਾਵਟ ਨੂੰ ਦੂਰ ਕਰੋ।
  • ਡਿਜੀਟਲ ਗਵਰਨੈਂਸ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਦਾ ਹੈ
  • ਭਾਰਤੀ ਭਾਸ਼ਾਵਾਂ ਵਿੱਚ ਸੇਵਾਵਾਂ ਅਤੇ ਉਤਪਾਦਾਂ ਲਈ ਇੱਕ ਈਕੋਸਿਸਟਮ ਬਣਾਉਣ ਲਈ ਉਤਪ੍ਰੇਰਕ
  • ਜਨਤਕ ਹਿੱਤਾਂ, ਖਾਸ ਕਰਕੇ, ਸ਼ਾਸਨ ਅਤੇ ਨੀਤੀ ਦੇ ਖੇਤਰਾਂ ਵਿੱਚ ਵਧੇਰੇ ਸਥਾਨਿਕ ਡਿਜੀਟਲ ਸਮੱਗਰੀ

ਅਸੀਂ ਗੱਲਬਾਤ ਦੇ ਏਆਈ ਖੇਤਰ ਵਿੱਚ ਸ਼ੈਪ ਦੀ ਮੁਹਾਰਤ ਤੋਂ ਹੈਰਾਨ ਹਾਂ। 8000 ਵਿਭਿੰਨ ਜ਼ਿਲ੍ਹਿਆਂ ਵਿੱਚ 800 ਘੰਟਿਆਂ ਦੇ ਆਡੀਓ ਡੇਟਾ ਦੇ ਨਾਲ-ਨਾਲ 80 ਘੰਟਿਆਂ ਦੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਸ਼ਨ ਨੂੰ ਸੰਭਾਲਣ ਦਾ ਕੰਮ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਸੀ, ਘੱਟੋ ਘੱਟ ਕਹਿਣਾ। ਇਹ ਸ਼ੈਪ ਦੀ ਇਸ ਡੋਮੇਨ ਦੇ ਗੁੰਝਲਦਾਰ ਵੇਰਵਿਆਂ ਅਤੇ ਸੂਖਮਤਾਵਾਂ ਦੀ ਡੂੰਘੀ ਸਮਝ ਸੀ ਜਿਸ ਨੇ ਅਜਿਹੇ ਚੁਣੌਤੀਪੂਰਨ ਪ੍ਰੋਜੈਕਟ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਲਾਗੂ ਕਰਨਾ ਸੰਭਵ ਬਣਾਇਆ। ਉੱਚ ਪੱਧਰੀ ਗੁਣਵੱਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋਏ ਡੇਟਾ ਦੀ ਇਸ ਵਿਸ਼ਾਲ ਮਾਤਰਾ ਦੀਆਂ ਗੁੰਝਲਾਂ ਨੂੰ ਸਹਿਜੇ ਹੀ ਪ੍ਰਬੰਧਨ ਅਤੇ ਨੈਵੀਗੇਟ ਕਰਨ ਦੀ ਉਨ੍ਹਾਂ ਦੀ ਯੋਗਤਾ ਸੱਚਮੁੱਚ ਸ਼ਲਾਘਾਯੋਗ ਹੈ।

ਗੋਲਡਨ-5-ਤਾਰਾ

ਆਪਣੀ ਗੱਲਬਾਤ AI ਨੂੰ ਤੇਜ਼ ਕਰੋ
100% ਦੁਆਰਾ ਐਪਲੀਕੇਸ਼ਨ ਵਿਕਾਸ