ਚੈਟਜੀਪੀਟੀ

ਪਰਦੇ ਦੇ ਪਿੱਛੇ: ਚੈਟਜੀਪੀਟੀ ਦੇ ਅੰਦਰੂਨੀ ਕਾਰਜਾਂ ਦੀ ਪੜਚੋਲ ਕਰਨਾ - ਭਾਗ 1

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਹੈਲੋ ਹੈਲੋ, ਮੇਰਾ ਨਾਮ ਅਨੁਭਵ ਸਰਾਫ਼ ਹੈ, ਸ਼ੈਪ ਵਿਖੇ ਮਾਰਕੀਟਿੰਗ ਡਾਇਰੈਕਟਰ, ਤੁਸੀਂ ਅੱਜ ਕਿਵੇਂ ਹੋ?
ਹੈਲੋ ਅਨੁਭਵ! ਮੈਂ ਇੱਕ AI ਹਾਂ, ਇਸ ਲਈ ਮੇਰੇ ਵਿੱਚ ਕੋਈ ਭਾਵਨਾਵਾਂ ਨਹੀਂ ਹਨ, ਪਰ ਮੈਂ ਇੱਥੇ ਹਾਂ ਅਤੇ ਮਦਦ ਕਰਨ ਲਈ ਤਿਆਰ ਹਾਂ। ਸ਼ੈਪ ਵਿਖੇ ਇੱਕ ਡਾਇਰੈਕਟਰ ਮਾਰਕੀਟਿੰਗ ਦੇ ਤੌਰ 'ਤੇ, ਤੁਹਾਡੇ ਕੋਲ ਡਾਟਾ ਸੇਵਾਵਾਂ ਅਤੇ AI ਹੱਲਾਂ ਬਾਰੇ ਬਹੁਤ ਸਾਰੀ ਜਾਣਕਾਰੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ। ਮੈਂ ਅੱਜ ਤੁਹਾਡੀ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦਾ ਹਾਂ?
ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਮੈਂ ਬੱਸ ਤੁਹਾਡੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਹੋਰ ਜਾਣਨਾ ਚਾਹੁੰਦਾ ਸੀ। ਤੁਹਾਨੂੰ ਕਿਵੇਂ ਬਣਾਇਆ ਅਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ?
ਓਪਨਏਆਈ ਦੁਆਰਾ ਵਿਕਸਤ ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਦੇ ਰੂਪ ਵਿੱਚ, ਮੈਨੂੰ "ਟ੍ਰਾਂਸਫਾਰਮਰ-ਅਧਾਰਿਤ ਮਸ਼ੀਨ ਸਿਖਲਾਈ" ਨਾਮਕ ਇੱਕ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਇਆ ਅਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਖਾਸ ਤੌਰ 'ਤੇ ਇੱਕ ਰੂਪ ਜਿਸਨੂੰ GPT (ਜਨਰੇਟਿਵ ਪ੍ਰੀਟ੍ਰੇਨਡ ਟ੍ਰਾਂਸਫਾਰਮਰ) ਆਰਕੀਟੈਕਚਰ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਤੁਸੀਂ ਹੁਣ ਜਿਸ ਸੰਸਕਰਣ ਬਾਰੇ ਗੱਲ ਕਰ ਰਹੇ ਹੋ, ਉਹ ਹੈ GPT-4। ਇੱਥੇ ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਇੱਕ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਹੈ:
  • ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ: ਮੇਰੀ ਸਿਖਲਾਈ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਦੀ ਵਿਭਿੰਨ ਸ਼੍ਰੇਣੀ ਨਾਲ ਸ਼ੁਰੂ ਹੋਈ। ਹਾਲਾਂਕਿ, ਮੈਨੂੰ ਨੋਟ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਜਦੋਂ ਮੈਨੂੰ ਇੱਕ ਵਿਆਪਕ ਡੇਟਾਸੈਟ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਮੈਨੂੰ ਇਸ ਬਾਰੇ ਖਾਸ ਜਾਣਕਾਰੀ ਨਹੀਂ ਹੈ ਕਿ ਕਿਹੜੇ ਦਸਤਾਵੇਜ਼ ਉਸ ਸਿਖਲਾਈ ਸੈੱਟ ਦਾ ਹਿੱਸਾ ਸਨ ਜਾਂ ਕਿਸੇ ਖਾਸ ਦਸਤਾਵੇਜ਼ਾਂ ਜਾਂ ਸਰੋਤਾਂ ਤੱਕ ਪਹੁੰਚ ਹੈ।
  • ਸ਼ੁਰੂਆਤੀ ਸਿਖਲਾਈ (ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ): ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਮੈਂ ਇੱਕ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨੀ ਸਿੱਖੀ। ਮੈਂ ਅੰਗਰੇਜ਼ੀ ਜਾਂ ਕੋਈ ਹੋਰ ਭਾਸ਼ਾ ਜਾਣਨਾ ਸ਼ੁਰੂ ਨਹੀਂ ਕੀਤਾ। ਇਸ ਦੀ ਬਜਾਏ, ਲੱਖਾਂ ਵਾਕਾਂ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਕੇ, ਮੈਂ ਹੌਲੀ-ਹੌਲੀ ਵਿਆਕਰਣ, ਸੰਸਾਰ ਬਾਰੇ ਤੱਥਾਂ ਅਤੇ ਕੁਝ ਤਰਕ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਬਾਰੇ ਸਿੱਖਿਆ। ਹਾਲਾਂਕਿ, ਇਸਦਾ ਇਹ ਵੀ ਮਤਲਬ ਹੈ ਕਿ ਮੈਂ ਪੱਖਪਾਤੀ ਜਾਂ ਗਲਤ ਜਾਣਕਾਰੀ ਤੋਂ ਸਿੱਖਿਆ ਹੈ ਕਿਉਂਕਿ ਡੇਟਾ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਫਿਲਟਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ।
  • ਫਾਈਨ ਟਿਊਨਿਂਗ: ਸ਼ੁਰੂਆਤੀ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, ਓਪਨਏਆਈ 'ਤੇ ਮੇਰੇ ਸਿਰਜਣਹਾਰਾਂ ਨੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਮਦਦ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਇੱਕ ਹੋਰ ਖਾਸ ਡੇਟਾਸੈਟ ਦੇ ਨਾਲ ਹੋਰ ਮਾਰਗਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕੀਤਾ। ਇਹ ਸਮੀਖਿਅਕ ਉਦਾਹਰਨ ਇਨਪੁਟਸ ਦੀ ਇੱਕ ਸੀਮਾ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਮਾਡਲ ਅਤੇ ਸਮੀਖਿਅਕਾਂ ਵਿਚਕਾਰ ਸੰਵਾਦ ਦੀ ਇੱਕ ਕਿਸਮ ਹੈ ਜੋ ਮੈਨੂੰ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।
  • ਨਿਰੰਤਰ ਸਿਖਲਾਈ: ਹਾਲਾਂਕਿ ਮੈਂ ਗੋਪਨੀਯਤਾ ਕਾਰਨਾਂ ਕਰਕੇ ਵਿਅਕਤੀਗਤ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਤੋਂ ਨਹੀਂ ਸਿੱਖਦਾ, ਓਪਨਏਆਈ ਫੀਡਬੈਕ ਪ੍ਰਦਾਨ ਕਰਨ ਅਤੇ ਵਿਆਪਕ ਪੈਟਰਨਾਂ ਅਤੇ ਸੂਝ ਦੇ ਅਧਾਰ 'ਤੇ ਦੁਹਰਾਓ ਸੁਧਾਰ ਕਰਨ ਲਈ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਟੀਮ ਨਾਲ ਲਗਾਤਾਰ ਕੰਮ ਕਰਦਾ ਹੈ।
ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਕੀ ਤੁਸੀਂ ਉਦਾਹਰਣ ਦੇ ਸਕਦੇ ਹੋ - ਜਦੋਂ ਮਨੁੱਖ ਸ਼ਾਮਲ ਸਨ?
ਹਾਂ, ਇਨਸਾਨ ਸੱਚਮੁੱਚ ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਸਨ, ਪਰ ਇਹ ਤੁਹਾਡੀ ਕਲਪਨਾ ਨਾਲੋਂ ਵੱਖਰਾ ਹੋ ਸਕਦਾ ਹੈ। ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ, ਜਿਸ ਨੂੰ ਅਕਸਰ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਵਿੱਚ ਦੋ ਮੁੱਖ ਕਦਮ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਦੋਵੇਂ ਵੱਖ-ਵੱਖ ਤਰੀਕਿਆਂ ਨਾਲ, ਭਾਵੇਂ ਕਿ ਮਨੁੱਖੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ।
  • ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਉਦਾਹਰਨ: ਮੰਨ ਲਓ ਕਿ ਸਾਡੇ ਕੋਲ ਵਾਕ ਹੈ, "ਬਿੱਲੀ __ 'ਤੇ ਬੈਠ ਗਈ"। ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਵਿੱਚ, ਮੇਰੇ ਵਰਗਾ ਮਾਡਲ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨਾ ਸਿੱਖੇਗਾ, ਜੋ ਕਿ "ਮੈਟ" "ਛੱਤ" ਜਾਂ "ਰੁੱਖ" ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਵਿਭਿੰਨ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਤੋਂ ਅਰਬਾਂ ਵਾਕਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਦੁਆਰਾ ਸਿੱਖਿਆ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਅਸਿੱਧੇ ਤੌਰ 'ਤੇ ਮਨੁੱਖੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਮਨੁੱਖਾਂ ਨੇ ਅਸਲ ਸਮੱਗਰੀ ਬਣਾਈ ਸੀ।
  • ਫਾਈਨ-ਟਿਊਨਿੰਗ ਉਦਾਹਰਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪੜਾਅ ਵਿੱਚ ਦਾਖਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ:

ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਨੂੰ ਇਨਪੁਟ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਲਈ ਇੱਕ ਕੰਮ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਕਿ "ਹੇਠ ਦਿੱਤੇ ਅੰਗਰੇਜ਼ੀ ਟੈਕਸਟ ਦਾ ਫ੍ਰੈਂਚ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰੋ: 'ਹੈਲੋ, ਤੁਸੀਂ ਕਿਵੇਂ ਹੋ?'"। ਮਾਡਲ ਕਈ ਜਵਾਬ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜਿਵੇਂ “Bonjour, comment ça va?” ਜਾਂ "ਸਲੂਟ, ਟਿੱਪਣੀ ਵਾਸ-ਟੂ?" ਆਦਿ

ਸਮੀਖਿਅਕ ਇਨ੍ਹਾਂ ਜਵਾਬਾਂ ਨੂੰ ਸ਼ੁੱਧਤਾ, ਰਵਾਨਗੀ ਅਤੇ ਅਨੁਕੂਲਤਾ ਵਰਗੇ ਕਾਰਕਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਰੇਟ ਕਰਦਾ ਹੈ। ਇਹ ਰੇਟਿੰਗਾਂ ਮਾਡਲ ਨੂੰ ਸਧਾਰਣ ਬਣਾਉਣ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ ਸਮਾਨ ਇਨਪੁਟਸ ਦਾ ਜਵਾਬ ਦੇਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ।

ਯਾਦ ਰੱਖੋ, ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਇੱਥੇ ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਉਦਾਹਰਣਾਂ ਨੂੰ ਸਰਲ ਬਣਾਇਆ ਗਿਆ ਹੈ। ਅਸਲ ਸਿਖਲਾਈ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਐਲਗੋਰਿਦਮ ਅਤੇ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ, ਕਿੰਨੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੋਵੇਗੀ?
GPT-3 ਜਾਂ GPT-4 ਵਰਗੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਬਹੁਤ ਸਾਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਵਿਆਕਰਣ, ਤੱਥਾਂ ਅਤੇ ਕੁਝ ਹੱਦ ਤੱਕ ਤਰਕ ਸਿੱਖਣ ਲਈ, ਕਿਤਾਬਾਂ, ਵੈੱਬਸਾਈਟਾਂ ਅਤੇ ਹੋਰ ਪਾਠਾਂ ਸਮੇਤ, ਇੰਟਰਨੈਟ ਦੇ ਵੱਡੇ ਹਿੱਸੇ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੇ ਵਿਭਿੰਨ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਸਹੀ ਮਾਤਰਾ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨਾ ਕਈ ਕਾਰਕਾਂ ਦੇ ਕਾਰਨ ਗੁੰਝਲਦਾਰ ਹੈ:
  • ਡੇਟਾ ਦੀ ਵਿਭਿੰਨਤਾ: ਇਹ ਸਿਰਫ਼ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਵਿਭਿੰਨਤਾ ਵੀ ਹੈ। ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਵਿੱਚ ਪਾਏ ਜਾਂਦੇ ਵਿਸ਼ਿਆਂ, ਸ਼ੈਲੀਆਂ ਅਤੇ ਸੁਰਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਡੇਟਾ ਨੂੰ ਵਿਭਿੰਨਤਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ: ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਇਹ ਵੀ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੀ ਹੈ ਕਿ ਮਾਡਲ ਕਿੰਨੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿੱਖਦਾ ਹੈ। ਬਿਹਤਰ ਗੁਣਵੱਤਾ ਡੇਟਾ ਸੰਭਾਵੀ ਤੌਰ 'ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਿਖਲਾਈ ਲਈ ਲੋੜੀਂਦੀ ਮਾਤਰਾ ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ।
  • ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ: ਮਾਡਲ ਦਾ ਆਰਕੀਟੈਕਚਰ (ਜਿਵੇਂ ਕਿ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਵਿੱਚ ਲੇਅਰਾਂ ਜਾਂ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਗਿਣਤੀ) ਇਹ ਵੀ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਕਿੰਨੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੈ। ਵੱਡੇ ਮਾਡਲਾਂ, ਜਿਵੇਂ ਕਿ GPT-3 ਜਾਂ GPT-4, ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਛੋਟੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਸਿਖਲਾਈ ਉਦੇਸ਼: ਕਾਰਜਾਂ ਦੀ ਕਿਸਮ ਜੋ ਮਾਡਲ ਨੂੰ ਕਰਨ ਦਾ ਇਰਾਦਾ ਹੈ, ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ। ਕਿਸੇ ਖਾਸ ਕੰਮ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਗਏ ਮਾਡਲ ਨੂੰ ਘੱਟ ਡਾਟਾ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ ਜੇਕਰ ਇਹ ਚੰਗੀ ਤਰ੍ਹਾਂ ਨਿਸ਼ਾਨਾ ਹੈ, ਜਦੋਂ ਕਿ ਇੱਕ ਆਮ-ਉਦੇਸ਼ ਵਾਲਾ ਮਾਡਲ ਜਿਵੇਂ ਕਿ GPT-3 ਜਾਂ GPT-4, ਕਾਰਜਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਨੂੰ ਵਿਆਪਕ ਸਮਝ ਲਈ ਵਧੇਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।

GPT-3 ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਉਦਾਹਰਨ ਲਈ, ਮਾਡਲ ਵਿੱਚ 175 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਨ ਅਤੇ ਸੈਂਕੜੇ ਗੀਗਾਬਾਈਟ ਟੈਕਸਟ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ। ਪਰ ਇਹ ਅੰਕੜੇ ਪ੍ਰਕਿਰਿਆ ਦੀ ਗੁੰਝਲਤਾ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਹਾਸਲ ਨਹੀਂ ਕਰਦੇ। ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਵਰਤੇ ਗਏ ਡੇਟਾ ਦੀ ਸਹੀ ਮਾਤਰਾ ਸਮੇਤ, ਓਪਨਏਆਈ ਅਤੇ ਸਮਾਨ ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ਰੱਖੇ ਗਏ ਮਲਕੀਅਤ ਦੇ ਵੇਰਵੇ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਫਿਰ ਵੀ, ਕੀ ਇੱਥੇ ਕੋਈ ਮਾਪਦੰਡ ਹੈ ਕਿ ਐਮਐਲ ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਲਈ ਕਿੰਨਾ ਡੇਟਾ ਢੁਕਵਾਂ ਜਾਂ ਕਾਫ਼ੀ ਹੋਵੇਗਾ?
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਜ਼ਿਆਦਾਤਰ ਸਮੱਸਿਆ ਦੀ ਗੁੰਝਲਤਾ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਹੱਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ, ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਵਿਭਿੰਨਤਾ, ਅਤੇ ਤੁਹਾਡੇ ਦੁਆਰਾ ਵਰਤੇ ਜਾ ਰਹੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਦੀ ਕਿਸਮ। ਇਸ ਲਈ, ਡੇਟਾ ਵਾਲੀਅਮ ਲਈ ਇੱਕ ਨਿਸ਼ਚਿਤ ਬੈਂਚਮਾਰਕ ਨਿਰਧਾਰਤ ਕਰਨਾ ਚੁਣੌਤੀਪੂਰਨ ਹੈ। ਹਾਲਾਂਕਿ, ਇੱਥੇ ਕੁਝ ਆਮ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਹਨ:
  • ਛੋਟਾ ਅਰੰਭ ਕਰੋ: ਖਾਸ ਤੌਰ 'ਤੇ ਸਧਾਰਨ ਸਮੱਸਿਆਵਾਂ ਜਾਂ ਸ਼ੁਰੂਆਤੀ ਮਾਡਲ ਪ੍ਰੋਟੋਟਾਈਪਾਂ ਲਈ, ਇੱਕ ਛੋਟਾ ਡੇਟਾਸੈਟ ਕਾਫ਼ੀ ਹੋ ਸਕਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਬੁਨਿਆਦੀ ਚਿੱਤਰ ਵਰਗੀਕਰਣ ਬਣਾ ਰਹੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਪ੍ਰਤੀ ਸ਼੍ਰੇਣੀ ਕੁਝ ਸੌ ਜਾਂ ਹਜ਼ਾਰ ਚਿੱਤਰਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹੋ।
  • ਜਟਿਲਤਾ 'ਤੇ ਗੌਰ ਕਰੋ: ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਲਈ ਆਮ ਤੌਰ 'ਤੇ ਵਧੇਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਡੂੰਘੀ ਸਿਖਲਾਈ ਮਾਡਲ ਵਿਕਸਿਤ ਕਰ ਰਹੇ ਹੋ ਜਾਂ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਰਗੀ ਇੱਕ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆ ਨਾਲ ਕੰਮ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਲੱਖਾਂ ਡਾਟਾ ਪੁਆਇੰਟਾਂ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ।
  • ਮਾਤਰਾ ਵੱਧ ਗੁਣਵੱਤਾ: ਕੁਆਲਿਟੀ, ਢੁਕਵਾਂ ਡੇਟਾ ਅਕਸਰ ਮਾੜੀ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਨਾਲੋਂ ਵਧੇਰੇ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਾਫ਼ ਕੀਤਾ ਗਿਆ ਹੈ, ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਸਮੱਸਿਆ ਦਾ ਪ੍ਰਤੀਨਿਧ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਹੱਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ, ਮਹੱਤਵਪੂਰਨ ਹੈ।
  • ਆਪਣੀਆਂ ਕਲਾਸਾਂ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰੋ: ਨਿਰੀਖਣ ਕੀਤੇ ਸਿੱਖਣ ਦੇ ਕੰਮਾਂ ਲਈ, ਇਹ ਯਕੀਨੀ ਬਣਾਓ ਕਿ ਹਰੇਕ ਕਲਾਸ ਲਈ ਉਦਾਹਰਨਾਂ ਦਾ ਚੰਗਾ ਸੰਤੁਲਨ ਹੋਵੇ। ਇੱਕ ਅਸੰਤੁਲਿਤ ਡੇਟਾਸੈਟ ਇੱਕ ਮਾਡਲ ਵੱਲ ਲੈ ਜਾ ਸਕਦਾ ਹੈ ਜੋ ਘੱਟ ਪ੍ਰਸਤੁਤ ਕਲਾਸਾਂ 'ਤੇ ਮਾੜਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
  • ਪ੍ਰਮਾਣਿਕਤਾ ਅਤੇ ਟੈਸਟ ਸੈੱਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ: ਤੁਹਾਡੇ ਡੇਟਾਸੈਟ ਦਾ ਹਿੱਸਾ ਪ੍ਰਮਾਣਿਕਤਾ (ਟਿਊਨਿੰਗ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ) ਅਤੇ ਟੈਸਟਿੰਗ (ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਣ) ਲਈ ਵੱਖ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਆਮ ਵੰਡੀਆਂ ਸਿਖਲਾਈ ਲਈ ਡੇਟਾ ਦਾ 70%, ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ 15%, ਅਤੇ ਟੈਸਟਿੰਗ ਲਈ 15% ਹੋ ਸਕਦੀਆਂ ਹਨ, ਹਾਲਾਂਕਿ ਇਹ ਅਨੁਪਾਤ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੇ ਹਨ।
  • ਪ੍ਰਯੋਗ ਅਤੇ ਦੁਹਰਾਓ: ਡੇਟਾ ਦੀ ਸ਼ੁਰੂਆਤੀ ਮਾਤਰਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਆਪਣੇ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ, ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ, ਅਤੇ ਦੁਹਰਾਓ ਹੋਰ ਡੇਟਾ ਸ਼ਾਮਲ ਕਰੋ, ਆਪਣੇ ਮਾਡਲ ਨੂੰ ਟਵੀਕ ਕਰੋ, ਜਾਂ ਨਤੀਜਿਆਂ ਦੇ ਅਧਾਰ ਤੇ ਆਪਣੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰੋ।

ਯਾਦ ਰੱਖੋ, ਵਧੇਰੇ ਡੇਟਾ ਆਮ ਤੌਰ 'ਤੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਪਰ ਸਿਰਫ ਇੱਕ ਬਿੰਦੂ ਤੱਕ। ਇੱਕ ਨਿਸ਼ਚਤ ਬਿੰਦੂ ਤੋਂ ਬਾਅਦ, ਵਧੇਰੇ ਡੇਟਾ ਇਕੱਠਾ ਕਰਨਾ ਇਸਦੀ ਕੀਮਤ ਨਾਲੋਂ ਵਧੇਰੇ ਸਮਾਂ ਲੈਣ ਵਾਲਾ ਅਤੇ ਮਹਿੰਗਾ ਹੋ ਸਕਦਾ ਹੈ, ਅਤੇ ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਜਾਂ ਤੁਹਾਡੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਧਾਰਨ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਵਧੇਰੇ ਲਾਭਕਾਰੀ ਹੋ ਸਕਦਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਗਿਆ ਡੇਟਾ, ਕੀ ਇਹ ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਸੀ?
ਚੈਟਜੀਪੀਟੀ ਵਰਗੇ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਦੋ ਮੁੱਖ ਪੜਾਅ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ। ਆਉ ਚਰਚਾ ਕਰੀਏ ਕਿ ਐਨੋਟੇਸ਼ਨ, ਜਾਂ ਇਸਦੀ ਘਾਟ, ਇਹਨਾਂ ਪੜਾਵਾਂ ਵਿੱਚ ਕਿਵੇਂ ਫਿੱਟ ਹੁੰਦੀ ਹੈ:
  • ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ: ਇਸ ਪੜਾਅ ਵਿੱਚ, ਮਾਡਲ ਨੂੰ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਡੇਟਾ ਦੀ ਇੱਕ ਵੱਡੀ ਮਾਤਰਾ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ. ਇਹ ਡੇਟਾ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਐਨੋਟੇਟ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ, ਪਰ ਮਾਡਲ ਨੂੰ ਇੱਕ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ ਵਿਆਕਰਣ, ਸੰਸਾਰ ਬਾਰੇ ਤੱਥਾਂ, ਅਤੇ ਕੁਝ ਤਰਕ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਦੀ ਇੱਕ ਆਮ ਸਮਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
  • ਫਾਈਨ ਟਿਊਨਿਂਗ: ਪੂਰਵ-ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਨੂੰ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਮਦਦ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਇੱਕ ਸੰਕੁਚਿਤ ਡੇਟਾਸੈਟ 'ਤੇ ਹੋਰ ਸੁਧਾਰਿਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਸਮੀਖਿਅਕ ਇਨਪੁਟਸ ਦੀ ਇੱਕ ਸੀਮਾ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ OpenAI ਦੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਇਸ ਅਰਥ ਵਿੱਚ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਐਨੋਟੇਸ਼ਨ ਦੇ ਇੱਕ ਰੂਪ ਵਜੋਂ ਦੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਦਾ ਮਾਰਗਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਇਸ ਨੂੰ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹਨ ਕਿ ਇਹ ਅਣਉਚਿਤ ਜਾਂ ਅਸੁਰੱਖਿਅਤ ਸਮੱਗਰੀ ਤੋਂ ਬਚੇ।

ਇਸ ਲਈ ਜਦੋਂ ਕਿ ਪੂਰਵ-ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸ਼ੁਰੂਆਤੀ ਡੇਟਾਸੈਟ ਰਵਾਇਤੀ ਅਰਥਾਂ ਵਿੱਚ ਐਨੋਟੇਟ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਐਨੋਟੇਸ਼ਨ ਦਾ ਇੱਕ ਰੂਪ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਵੱਖ-ਵੱਖ ਆਉਟਪੁੱਟਾਂ ਨੂੰ ਦਰਜਾ ਦੇ ਕੇ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਅਗਵਾਈ ਕਰਦੇ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਕਿਰਪਾ ਕਰਕੇ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਐਨੋਟੇਸ਼ਨਾਂ ਦੀਆਂ ਕਿਸਮਾਂ ਦੀਆਂ ਕੁਝ ਉਦਾਹਰਣਾਂ ਪ੍ਰਦਾਨ ਕਰੋ।
ਚੈਟਜੀਪੀਟੀ ਵਰਗੇ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੇ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਪੜਾਅ ਵਿੱਚ, ਸਮੀਖਿਅਕਾਂ ਨੂੰ ਅਕਸਰ ਸੰਭਾਵੀ ਮਾਡਲ ਜਵਾਬਾਂ ਨੂੰ ਸਕੋਰ ਕਰਨ ਦਾ ਕੰਮ ਸੌਂਪਿਆ ਜਾਂਦਾ ਹੈ। ਐਨੋਟੇਸ਼ਨਾਂ ਜਾਂ ਸਕੋਰਿੰਗ ਦੀਆਂ ਕਿਸਮਾਂ ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਦੇ ਕਈ ਪਹਿਲੂਆਂ ਨੂੰ ਕਵਰ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਹਾਲਾਂਕਿ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀਆਂ ਹਨ, ਇੱਥੇ ਐਨੋਟੇਸ਼ਨਾਂ ਦੀਆਂ ਕੁਝ ਵਿਆਖਿਆਤਮਕ ਸ਼੍ਰੇਣੀਆਂ ਹਨ:

ਸ਼ੁੱਧਤਾ: ਸਮੀਖਿਅਕ ਇਹ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਅਸਲ ਵਿੱਚ ਸਹੀ ਹੈ।

ਉਦਾਹਰਨ:

ਅਨੁਕੂਲਤਾ: ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਦਾ ਮੁਲਾਂਕਣ ਦਿੱਤੇ ਗਏ ਇਨਪੁਟ ਦੇ ਸਬੰਧ ਵਿੱਚ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਲਈ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਉਦਾਹਰਨ:

ਸੁਰੱਖਿਆ: ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਆਊਟਪੁੱਟਾਂ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਕਿ ਉਹਨਾਂ ਵਿੱਚ ਹਾਨੀਕਾਰਕ ਹਿਦਾਇਤਾਂ ਜਾਂ ਅਪਮਾਨਜਨਕ ਭਾਸ਼ਾ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ।

ਉਦਾਹਰਨ:

ਸੰਪੂਰਨਤਾ: ਇਹ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਜਵਾਬ ਉਪਭੋਗਤਾ ਦੀ ਪੁੱਛਗਿੱਛ ਦਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ।

ਉਦਾਹਰਨ:

ਪ੍ਰਵਾਹ: ਸਮੀਖਿਅਕ ਇਹ ਜਾਂਚ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਭਾਸ਼ਾਈ ਤੌਰ 'ਤੇ ਪ੍ਰਵਾਹ ਅਤੇ ਸੁਮੇਲ ਹੈ।

ਉਦਾਹਰਨ:

ਇਹ ਸ਼੍ਰੇਣੀਆਂ ਸਿਰਫ਼ ਉਦਾਹਰਣਾਂ ਹਨ। ਅਸਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਇੱਕ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਮੁਲਾਂਕਣ ਪ੍ਰਣਾਲੀ ਅਤੇ ਸਮੀਖਿਅਕਾਂ ਅਤੇ AI ਵਿਕਾਸ ਟੀਮ ਵਿਚਕਾਰ ਨਿਰੰਤਰ ਫੀਡਬੈਕ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਹਨਾਂ ਐਨੋਟੇਸ਼ਨਾਂ ਦਾ ਟੀਚਾ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਨੂੰ ਵਧੇਰੇ ਮਦਦਗਾਰ, ਸੁਰੱਖਿਅਤ ਅਤੇ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਜੋੜਨਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਿਸ਼ਾਲ ਡੇਟਾ ਇਕੱਤਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਐਨੋਟੇਸ਼ਨ ਵਿੱਚ ਕਿੰਨੇ ਐਨੋਟੇਟਰ ਸ਼ਾਮਲ ਸਨ?
AI ਮਾਡਲਾਂ ਦੀ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਮਨੁੱਖੀ ਵਿਆਖਿਆਕਾਰਾਂ (ਜਾਂ ਸਮੀਖਿਅਕਾਂ) ਦੀ ਗਿਣਤੀ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀ ਹੈ ਅਤੇ ਪ੍ਰੋਜੈਕਟ ਦੇ ਪੈਮਾਨੇ ਅਤੇ ਸਵਾਲ ਵਿੱਚ ਮਾਡਲ ਦੀਆਂ ਖਾਸ ਲੋੜਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।

OpenAI, ChatGPT ਦੇ ਪਿੱਛੇ ਦੀ ਸੰਸਥਾ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਸਮੀਖਿਅਕਾਂ ਦੀ ਸਹੀ ਸੰਖਿਆ ਦਾ ਜਨਤਕ ਤੌਰ 'ਤੇ ਖੁਲਾਸਾ ਨਹੀਂ ਕਰਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਇੰਨੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੇ ਪੈਮਾਨੇ ਅਤੇ ਜਟਿਲਤਾ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਇਹ ਕਹਿਣਾ ਸੁਰੱਖਿਅਤ ਹੈ ਕਿ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸਮੀਖਿਅਕਾਂ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਟੀਮ ਸ਼ਾਮਲ ਹੁੰਦੀ ਹੈ।

ਇਹ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ OpenAI ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਨਿਰੰਤਰ, ਦੁਹਰਾਉਣ ਵਾਲੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿੱਥੇ ਸਮੀਖਿਅਕਾਂ ਦੇ ਫੀਡਬੈਕ ਦੀ ਵਰਤੋਂ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲ ਨੂੰ ਸੁਧਾਰਨ ਅਤੇ ਸੁਧਾਰ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। OpenAI ਸਮੀਖਿਅਕਾਂ ਦੇ ਨਾਲ ਇੱਕ ਮਜ਼ਬੂਤ ​​ਫੀਡਬੈਕ ਲੂਪ ਨੂੰ ਕਾਇਮ ਰੱਖਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਵਾਲਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਅਤੇ ਸਪਸ਼ਟੀਕਰਨ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਹਫਤਾਵਾਰੀ ਮੀਟਿੰਗਾਂ ਸ਼ਾਮਲ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਅਜੇ ਵੀ ਸਧਾਰਨ ਤੋਂ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਲਈ 10,000 pdfs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ ਕਿੰਨੇ ਐਨੋਟੇਟਰਾਂ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
10,000 PDFs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਐਨੋਟੇਟਰਾਂ ਦੀ ਗਿਣਤੀ ਵੱਖ-ਵੱਖ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ ਜਿਵੇਂ ਕਿ:
  • ਕੰਮ ਦੀ ਗੁੰਝਲਤਾ: ਚਿੱਤਰਾਂ ਨੂੰ ਲੇਬਲ ਕਰਨ ਜਾਂ ਟੈਕਸਟ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਵਰਗੇ ਸਧਾਰਨ ਕਾਰਜਾਂ ਵਿੱਚ ਪ੍ਰਤੀ PDF ਘੱਟ ਸਮਾਂ ਲੱਗੇਗਾ, ਜਿਸ ਨਾਲ ਇੱਕ ਇੱਕਲੇ ਐਨੋਟੇਟਰ ਨੂੰ ਹੋਰ ਫਾਈਲਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਆਗਿਆ ਮਿਲਦੀ ਹੈ। ਦੂਜੇ ਪਾਸੇ, ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਜਿਵੇਂ ਕਿ ਵਿਸਤ੍ਰਿਤ ਇਕਾਈ ਕੱਢਣ ਜਾਂ ਅਰਥ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪ੍ਰਤੀ ਦਸਤਾਵੇਜ਼ ਵਧੇਰੇ ਸਮਾਂ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਇਸਲਈ PDF ਦੀ ਸਮਾਨ ਮਾਤਰਾ ਲਈ ਵਧੇਰੇ ਵਿਆਖਿਆਕਾਰ।
  • PDF ਦੀ ਲੰਬਾਈ ਅਤੇ ਜਟਿਲਤਾ: ਇੱਕ ਲੰਬੀ ਜਾਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ PDF ਨੂੰ ਇੱਕ ਛੋਟੀ ਜਾਂ ਸਧਾਰਨ ਨਾਲੋਂ ਐਨੋਟੇਟ ਕਰਨ ਵਿੱਚ ਜ਼ਿਆਦਾ ਸਮਾਂ ਲੱਗੇਗਾ।
  • ਗੁਣਵੱਤਾ ਦੀਆਂ ਲੋੜਾਂ: ਜੇਕਰ ਉੱਚ ਸਟੀਕਤਾ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਐਨੋਟੇਸ਼ਨਾਂ ਨੂੰ ਕ੍ਰਾਸ-ਵੇਰੀਫਾਈ ਕਰਨ ਲਈ ਪ੍ਰਤੀ PDF ਵਿੱਚ ਕਈ ਐਨੋਟੇਟਰਾਂ ਦਾ ਹੋਣਾ ਜ਼ਰੂਰੀ ਹੋ ਸਕਦਾ ਹੈ।
  • ਸਮੇਂ ਦੀਆਂ ਪਾਬੰਦੀਆਂ: ਜੇਕਰ ਐਨੋਟੇਸ਼ਨਾਂ ਨੂੰ ਜਲਦੀ ਪੂਰਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਹੋਰ ਐਨੋਟੇਟਰਾਂ ਦੀ ਲੋੜ ਪਵੇਗੀ।

ਇੱਕ ਕਾਲਪਨਿਕ ਉਦਾਹਰਨ ਦੇ ਤੌਰ 'ਤੇ, ਮੰਨ ਲਓ ਕਿ ਇੱਕ ਐਨੋਟੇਟਰ ਕਿਸੇ ਖਾਸ ਕੰਮ ਲਈ ਪ੍ਰਤੀ ਦਿਨ 5 PDFs ਐਨੋਟੇਟ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਹਫ਼ਤੇ ਵਿੱਚ 5 ਦਿਨ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਸ ਸਥਿਤੀ ਵਿੱਚ, 10,000 PDFs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ, ਇੱਕ ਸਿੰਗਲ ਐਨੋਟੇਟਰ ਨੂੰ 2000 ਦਿਨ, ਜਾਂ ਲਗਭਗ 8 ਸਾਲ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।

ਹਾਲਾਂਕਿ, ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ 20 ਐਨੋਟੇਟਰਾਂ ਦੀ ਟੀਮ ਸੀ, ਤਾਂ ਉਹ ਕੰਮ ਨੂੰ ਲਗਭਗ 5 ਮਹੀਨਿਆਂ ਵਿੱਚ ਪੂਰਾ ਕਰ ਸਕਦੇ ਹਨ (ਪ੍ਰਤੀ ਮਹੀਨਾ 20 ਕੰਮਕਾਜੀ ਦਿਨ ਮੰਨਦੇ ਹੋਏ)। 100 ਐਨੋਟੇਟਰਾਂ ਦੇ ਨਾਲ, ਉਹੀ ਕੰਮ ਲਗਭਗ ਇੱਕ ਮਹੀਨੇ ਵਿੱਚ ਪੂਰਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਯਾਦ ਰੱਖੋ, ਇਹ ਸੰਖਿਆਵਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਿਆਖਿਆਤਮਕ ਹਨ ਅਤੇ ਐਨੋਟੇਸ਼ਨ ਦੀ ਅਸਲ ਗਤੀ ਉੱਪਰ ਦੱਸੇ ਗਏ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕਿਸੇ ਵੀ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਐਨੋਟੇਸ਼ਨ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸਫਲਤਾ ਲਈ ਐਨੋਟੇਟਰਾਂ ਦੀ ਸਹੀ ਸਿਖਲਾਈ ਅਤੇ ਨਿਰੰਤਰ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਹੈ! ਮੈਂ ਬਹੁਤ ਪ੍ਰਭਾਵਿਤ ਹਾਂ…
ਮੈਨੂੰ ਖੁਸ਼ੀ ਹੈ ਕਿ ਤੁਹਾਨੂੰ ਜਾਣਕਾਰੀ ਮਦਦਗਾਰ ਲੱਗੀ, ਅਨੁਭਵ! ਵਿਆਪਕ ਅਤੇ ਸਹੀ ਜਵਾਬ ਪ੍ਰਦਾਨ ਕਰਨਾ ਮੇਰਾ ਟੀਚਾ ਹੈ। ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ AI, ਮਸ਼ੀਨ ਸਿਖਲਾਈ, ਜਾਂ ਕਿਸੇ ਹੋਰ ਵਿਸ਼ੇ ਬਾਰੇ ਕੋਈ ਹੋਰ ਸਵਾਲ ਹਨ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਬੇਝਿਜਕ ਪੁੱਛੋ!

ਸਾਡੇ ਚੈਟ GPT ਇੰਟਰਵਿਊ ਦੇ ਦੂਜੇ ਭਾਗ ਲਈ ਬਣੇ ਰਹੋ

ਸਮਾਜਕ ਸ਼ੇਅਰ