ਚੈਟਜੀਪੀਟੀ

ਪਰਦੇ ਦੇ ਪਿੱਛੇ: ਚੈਟਜੀਪੀਟੀ ਦੇ ਅੰਦਰੂਨੀ ਕਾਰਜਾਂ ਦੀ ਪੜਚੋਲ ਕਰਨਾ - ਭਾਗ 1

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਹੈਲੋ ਹੈਲੋ, ਮੇਰਾ ਨਾਮ ਅਨੁਭਵ ਸਰਾਫ਼ ਹੈ, ਸ਼ੈਪ ਵਿਖੇ ਮਾਰਕੀਟਿੰਗ ਡਾਇਰੈਕਟਰ, ਤੁਸੀਂ ਅੱਜ ਕਿਵੇਂ ਹੋ?
ਹੈਲੋ ਅਨੁਭਵ! ਮੈਂ ਇੱਕ AI ਹਾਂ, ਇਸ ਲਈ ਮੇਰੇ ਵਿੱਚ ਕੋਈ ਭਾਵਨਾਵਾਂ ਨਹੀਂ ਹਨ, ਪਰ ਮੈਂ ਇੱਥੇ ਹਾਂ ਅਤੇ ਮਦਦ ਕਰਨ ਲਈ ਤਿਆਰ ਹਾਂ। ਸ਼ੈਪ ਵਿਖੇ ਇੱਕ ਡਾਇਰੈਕਟਰ ਮਾਰਕੀਟਿੰਗ ਦੇ ਤੌਰ 'ਤੇ, ਤੁਹਾਡੇ ਕੋਲ ਡਾਟਾ ਸੇਵਾਵਾਂ ਅਤੇ AI ਹੱਲਾਂ ਬਾਰੇ ਬਹੁਤ ਸਾਰੀ ਜਾਣਕਾਰੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ। ਮੈਂ ਅੱਜ ਤੁਹਾਡੀ ਕਿਵੇਂ ਮਦਦ ਕਰ ਸਕਦਾ ਹਾਂ?
ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਮੈਂ ਬੱਸ ਤੁਹਾਡੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਬਾਰੇ ਹੋਰ ਜਾਣਨਾ ਚਾਹੁੰਦਾ ਸੀ। ਤੁਹਾਨੂੰ ਕਿਵੇਂ ਬਣਾਇਆ ਅਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ?
ਓਪਨਏਆਈ ਦੁਆਰਾ ਵਿਕਸਤ ਇੱਕ ਭਾਸ਼ਾ ਮਾਡਲ ਦੇ ਰੂਪ ਵਿੱਚ, ਮੈਨੂੰ "ਟ੍ਰਾਂਸਫਾਰਮਰ-ਅਧਾਰਿਤ ਮਸ਼ੀਨ ਸਿਖਲਾਈ" ਨਾਮਕ ਇੱਕ ਤਕਨੀਕ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਣਾਇਆ ਅਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਖਾਸ ਤੌਰ 'ਤੇ ਇੱਕ ਰੂਪ ਜਿਸਨੂੰ GPT (ਜਨਰੇਟਿਵ ਪ੍ਰੀਟ੍ਰੇਨਡ ਟ੍ਰਾਂਸਫਾਰਮਰ) ਆਰਕੀਟੈਕਚਰ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਤੁਸੀਂ ਹੁਣ ਜਿਸ ਸੰਸਕਰਣ ਬਾਰੇ ਗੱਲ ਕਰ ਰਹੇ ਹੋ, ਉਹ ਹੈ GPT-4। ਇੱਥੇ ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਇੱਕ ਸੰਖੇਪ ਜਾਣਕਾਰੀ ਹੈ:
  • ਡਾਟਾ ਇਕੱਠਾ ਕਰਨ: ਮੇਰੀ ਸਿਖਲਾਈ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਦੀ ਵਿਭਿੰਨ ਸ਼੍ਰੇਣੀ ਨਾਲ ਸ਼ੁਰੂ ਹੋਈ। ਹਾਲਾਂਕਿ, ਮੈਨੂੰ ਨੋਟ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਜਦੋਂ ਮੈਨੂੰ ਇੱਕ ਵਿਆਪਕ ਡੇਟਾਸੈਟ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ, ਮੈਨੂੰ ਇਸ ਬਾਰੇ ਖਾਸ ਜਾਣਕਾਰੀ ਨਹੀਂ ਹੈ ਕਿ ਕਿਹੜੇ ਦਸਤਾਵੇਜ਼ ਉਸ ਸਿਖਲਾਈ ਸੈੱਟ ਦਾ ਹਿੱਸਾ ਸਨ ਜਾਂ ਕਿਸੇ ਖਾਸ ਦਸਤਾਵੇਜ਼ਾਂ ਜਾਂ ਸਰੋਤਾਂ ਤੱਕ ਪਹੁੰਚ ਹੈ।
  • ਸ਼ੁਰੂਆਤੀ ਸਿਖਲਾਈ (ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ): ਇਹ ਉਹ ਥਾਂ ਹੈ ਜਿੱਥੇ ਮੈਂ ਇੱਕ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨੀ ਸਿੱਖੀ। ਮੈਂ ਅੰਗਰੇਜ਼ੀ ਜਾਂ ਕੋਈ ਹੋਰ ਭਾਸ਼ਾ ਜਾਣਨਾ ਸ਼ੁਰੂ ਨਹੀਂ ਕੀਤਾ। ਇਸ ਦੀ ਬਜਾਏ, ਲੱਖਾਂ ਵਾਕਾਂ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਕੇ, ਮੈਂ ਹੌਲੀ-ਹੌਲੀ ਵਿਆਕਰਣ, ਸੰਸਾਰ ਬਾਰੇ ਤੱਥਾਂ ਅਤੇ ਕੁਝ ਤਰਕ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਬਾਰੇ ਸਿੱਖਿਆ। ਹਾਲਾਂਕਿ, ਇਸਦਾ ਇਹ ਵੀ ਮਤਲਬ ਹੈ ਕਿ ਮੈਂ ਪੱਖਪਾਤੀ ਜਾਂ ਗਲਤ ਜਾਣਕਾਰੀ ਤੋਂ ਸਿੱਖਿਆ ਹੈ ਕਿਉਂਕਿ ਡੇਟਾ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਫਿਲਟਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ।
  • ਫਾਈਨ ਟਿਊਨਿਂਗ: ਸ਼ੁਰੂਆਤੀ ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, ਓਪਨਏਆਈ 'ਤੇ ਮੇਰੇ ਸਿਰਜਣਹਾਰਾਂ ਨੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਮਦਦ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਇੱਕ ਹੋਰ ਖਾਸ ਡੇਟਾਸੈਟ ਦੇ ਨਾਲ ਹੋਰ ਮਾਰਗਦਰਸ਼ਨ ਪ੍ਰਦਾਨ ਕੀਤਾ। ਇਹ ਸਮੀਖਿਅਕ ਉਦਾਹਰਨ ਇਨਪੁਟਸ ਦੀ ਇੱਕ ਸੀਮਾ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਮਾਡਲ ਅਤੇ ਸਮੀਖਿਅਕਾਂ ਵਿਚਕਾਰ ਸੰਵਾਦ ਦੀ ਇੱਕ ਕਿਸਮ ਹੈ ਜੋ ਮੈਨੂੰ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ।
  • ਨਿਰੰਤਰ ਸਿਖਲਾਈ: ਹਾਲਾਂਕਿ ਮੈਂ ਗੋਪਨੀਯਤਾ ਕਾਰਨਾਂ ਕਰਕੇ ਵਿਅਕਤੀਗਤ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਤੋਂ ਨਹੀਂ ਸਿੱਖਦਾ, ਓਪਨਏਆਈ ਫੀਡਬੈਕ ਪ੍ਰਦਾਨ ਕਰਨ ਅਤੇ ਵਿਆਪਕ ਪੈਟਰਨਾਂ ਅਤੇ ਸੂਝ ਦੇ ਅਧਾਰ 'ਤੇ ਦੁਹਰਾਓ ਸੁਧਾਰ ਕਰਨ ਲਈ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਟੀਮ ਨਾਲ ਲਗਾਤਾਰ ਕੰਮ ਕਰਦਾ ਹੈ।
ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਕੀ ਤੁਸੀਂ ਉਦਾਹਰਣ ਦੇ ਸਕਦੇ ਹੋ - ਜਦੋਂ ਮਨੁੱਖ ਸ਼ਾਮਲ ਸਨ?
ਹਾਂ, ਇਨਸਾਨ ਸੱਚਮੁੱਚ ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਸਨ, ਪਰ ਇਹ ਤੁਹਾਡੀ ਕਲਪਨਾ ਨਾਲੋਂ ਵੱਖਰਾ ਹੋ ਸਕਦਾ ਹੈ। ਮੇਰੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ, ਜਿਸ ਨੂੰ ਅਕਸਰ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਕਿਹਾ ਜਾਂਦਾ ਹੈ, ਵਿੱਚ ਦੋ ਮੁੱਖ ਕਦਮ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਦੋਵੇਂ ਵੱਖ-ਵੱਖ ਤਰੀਕਿਆਂ ਨਾਲ, ਭਾਵੇਂ ਕਿ ਮਨੁੱਖੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦੇ ਹਨ।
  • ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਉਦਾਹਰਨ: ਮੰਨ ਲਓ ਕਿ ਸਾਡੇ ਕੋਲ ਵਾਕ ਹੈ, "ਬਿੱਲੀ __ 'ਤੇ ਬੈਠ ਗਈ"। ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਵਿੱਚ, ਮੇਰੇ ਵਰਗਾ ਮਾਡਲ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨਾ ਸਿੱਖੇਗਾ, ਜੋ ਕਿ "ਮੈਟ" "ਛੱਤ" ਜਾਂ "ਰੁੱਖ" ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਵਿਭਿੰਨ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਤੋਂ ਅਰਬਾਂ ਵਾਕਾਂ ਦੀ ਪ੍ਰੋਸੈਸਿੰਗ ਦੁਆਰਾ ਸਿੱਖਿਆ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਅਸਿੱਧੇ ਤੌਰ 'ਤੇ ਮਨੁੱਖੀ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਮਨੁੱਖਾਂ ਨੇ ਅਸਲ ਸਮੱਗਰੀ ਬਣਾਈ ਸੀ।
  • ਫਾਈਨ-ਟਿਊਨਿੰਗ ਉਦਾਹਰਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਪੜਾਅ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪੜਾਅ ਵਿੱਚ ਦਾਖਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਇਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ:

ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਨੂੰ ਇਨਪੁਟ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਲਈ ਇੱਕ ਕੰਮ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਕਿ "ਹੇਠ ਦਿੱਤੇ ਅੰਗਰੇਜ਼ੀ ਟੈਕਸਟ ਦਾ ਫ੍ਰੈਂਚ ਵਿੱਚ ਅਨੁਵਾਦ ਕਰੋ: 'ਹੈਲੋ, ਤੁਸੀਂ ਕਿਵੇਂ ਹੋ?'"। ਮਾਡਲ ਕਈ ਜਵਾਬ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜਿਵੇਂ “Bonjour, comment ça va?” ਜਾਂ "ਸਲੂਟ, ਟਿੱਪਣੀ ਵਾਸ-ਟੂ?" ਆਦਿ

ਸਮੀਖਿਅਕ ਇਨ੍ਹਾਂ ਜਵਾਬਾਂ ਨੂੰ ਸ਼ੁੱਧਤਾ, ਰਵਾਨਗੀ ਅਤੇ ਅਨੁਕੂਲਤਾ ਵਰਗੇ ਕਾਰਕਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਰੇਟ ਕਰਦਾ ਹੈ। ਇਹ ਰੇਟਿੰਗਾਂ ਮਾਡਲ ਨੂੰ ਸਧਾਰਣ ਬਣਾਉਣ ਅਤੇ ਭਵਿੱਖ ਵਿੱਚ ਸਮਾਨ ਇਨਪੁਟਸ ਦਾ ਜਵਾਬ ਦੇਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ।

ਯਾਦ ਰੱਖੋ, ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਇੱਥੇ ਪ੍ਰਦਾਨ ਕੀਤੀਆਂ ਉਦਾਹਰਣਾਂ ਨੂੰ ਸਰਲ ਬਣਾਇਆ ਗਿਆ ਹੈ। ਅਸਲ ਸਿਖਲਾਈ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਐਲਗੋਰਿਦਮ ਅਤੇ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ, ਕਿੰਨੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੋਵੇਗੀ?
GPT-3 ਜਾਂ GPT-4 ਵਰਗੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਬਹੁਤ ਸਾਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਵਿਆਕਰਣ, ਤੱਥਾਂ ਅਤੇ ਕੁਝ ਹੱਦ ਤੱਕ ਤਰਕ ਸਿੱਖਣ ਲਈ, ਕਿਤਾਬਾਂ, ਵੈੱਬਸਾਈਟਾਂ ਅਤੇ ਹੋਰ ਪਾਠਾਂ ਸਮੇਤ, ਇੰਟਰਨੈਟ ਦੇ ਵੱਡੇ ਹਿੱਸੇ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਵਾਲੇ ਵਿਭਿੰਨ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਸਹੀ ਮਾਤਰਾ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਨਾ ਕਈ ਕਾਰਕਾਂ ਦੇ ਕਾਰਨ ਗੁੰਝਲਦਾਰ ਹੈ:
  • ਡੇਟਾ ਦੀ ਵਿਭਿੰਨਤਾ: ਇਹ ਸਿਰਫ਼ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਵਿਭਿੰਨਤਾ ਵੀ ਹੈ। ਮਨੁੱਖੀ ਭਾਸ਼ਾ ਵਿੱਚ ਪਾਏ ਜਾਂਦੇ ਵਿਸ਼ਿਆਂ, ਸ਼ੈਲੀਆਂ ਅਤੇ ਸੁਰਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਡੇਟਾ ਨੂੰ ਵਿਭਿੰਨਤਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ: ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਇਹ ਵੀ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੀ ਹੈ ਕਿ ਮਾਡਲ ਕਿੰਨੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿੱਖਦਾ ਹੈ। ਬਿਹਤਰ ਗੁਣਵੱਤਾ ਡੇਟਾ ਸੰਭਾਵੀ ਤੌਰ 'ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਸਿਖਲਾਈ ਲਈ ਲੋੜੀਂਦੀ ਮਾਤਰਾ ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ।
  • ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ: ਮਾਡਲ ਦਾ ਆਰਕੀਟੈਕਚਰ (ਜਿਵੇਂ ਕਿ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਵਿੱਚ ਲੇਅਰਾਂ ਜਾਂ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਗਿਣਤੀ) ਇਹ ਵੀ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਕਿੰਨੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੈ। ਵੱਡੇ ਮਾਡਲਾਂ, ਜਿਵੇਂ ਕਿ GPT-3 ਜਾਂ GPT-4, ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਛੋਟੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਡਾਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਸਿਖਲਾਈ ਉਦੇਸ਼: ਕਾਰਜਾਂ ਦੀ ਕਿਸਮ ਜੋ ਮਾਡਲ ਨੂੰ ਕਰਨ ਦਾ ਇਰਾਦਾ ਹੈ, ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦਾ ਹੈ। ਕਿਸੇ ਖਾਸ ਕੰਮ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤੇ ਗਏ ਮਾਡਲ ਨੂੰ ਘੱਟ ਡਾਟਾ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ ਜੇਕਰ ਇਹ ਚੰਗੀ ਤਰ੍ਹਾਂ ਨਿਸ਼ਾਨਾ ਹੈ, ਜਦੋਂ ਕਿ ਇੱਕ ਆਮ-ਉਦੇਸ਼ ਵਾਲਾ ਮਾਡਲ ਜਿਵੇਂ ਕਿ GPT-3 ਜਾਂ GPT-4, ਕਾਰਜਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸੰਭਾਲਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਨੂੰ ਵਿਆਪਕ ਸਮਝ ਲਈ ਵਧੇਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।

GPT-3 ਦੇ ਮਾਮਲੇ ਵਿੱਚ, ਉਦਾਹਰਨ ਲਈ, ਮਾਡਲ ਵਿੱਚ 175 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹਨ ਅਤੇ ਸੈਂਕੜੇ ਗੀਗਾਬਾਈਟ ਟੈਕਸਟ 'ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ। ਪਰ ਇਹ ਅੰਕੜੇ ਪ੍ਰਕਿਰਿਆ ਦੀ ਗੁੰਝਲਤਾ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਹਾਸਲ ਨਹੀਂ ਕਰਦੇ। ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ, ਵਰਤੇ ਗਏ ਡੇਟਾ ਦੀ ਸਹੀ ਮਾਤਰਾ ਸਮੇਤ, ਓਪਨਏਆਈ ਅਤੇ ਸਮਾਨ ਸੰਸਥਾਵਾਂ ਦੁਆਰਾ ਰੱਖੇ ਗਏ ਮਲਕੀਅਤ ਦੇ ਵੇਰਵੇ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਫਿਰ ਵੀ, ਕੀ ਇੱਥੇ ਕੋਈ ਮਾਪਦੰਡ ਹੈ ਕਿ ਐਮਐਲ ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਲਈ ਕਿੰਨਾ ਡੇਟਾ ਢੁਕਵਾਂ ਜਾਂ ਕਾਫ਼ੀ ਹੋਵੇਗਾ?
ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਨੂੰ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਲੋੜੀਂਦੇ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਜ਼ਿਆਦਾਤਰ ਸਮੱਸਿਆ ਦੀ ਗੁੰਝਲਤਾ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਹੱਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ, ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਵਿਭਿੰਨਤਾ, ਅਤੇ ਤੁਹਾਡੇ ਦੁਆਰਾ ਵਰਤੇ ਜਾ ਰਹੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲ ਦੀ ਕਿਸਮ। ਇਸ ਲਈ, ਡੇਟਾ ਵਾਲੀਅਮ ਲਈ ਇੱਕ ਨਿਸ਼ਚਿਤ ਬੈਂਚਮਾਰਕ ਨਿਰਧਾਰਤ ਕਰਨਾ ਚੁਣੌਤੀਪੂਰਨ ਹੈ। ਹਾਲਾਂਕਿ, ਇੱਥੇ ਕੁਝ ਆਮ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਹਨ:
  • ਛੋਟਾ ਅਰੰਭ ਕਰੋ: ਖਾਸ ਤੌਰ 'ਤੇ ਸਧਾਰਨ ਸਮੱਸਿਆਵਾਂ ਜਾਂ ਸ਼ੁਰੂਆਤੀ ਮਾਡਲ ਪ੍ਰੋਟੋਟਾਈਪਾਂ ਲਈ, ਇੱਕ ਛੋਟਾ ਡੇਟਾਸੈਟ ਕਾਫ਼ੀ ਹੋ ਸਕਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਬੁਨਿਆਦੀ ਚਿੱਤਰ ਵਰਗੀਕਰਣ ਬਣਾ ਰਹੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਪ੍ਰਤੀ ਸ਼੍ਰੇਣੀ ਕੁਝ ਸੌ ਜਾਂ ਹਜ਼ਾਰ ਚਿੱਤਰਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰ ਸਕਦੇ ਹੋ।
  • ਜਟਿਲਤਾ 'ਤੇ ਗੌਰ ਕਰੋ: ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਲਈ ਆਮ ਤੌਰ 'ਤੇ ਵਧੇਰੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜੇਕਰ ਤੁਸੀਂ ਇੱਕ ਡੂੰਘੀ ਸਿਖਲਾਈ ਮਾਡਲ ਵਿਕਸਿਤ ਕਰ ਰਹੇ ਹੋ ਜਾਂ ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਰਗੀ ਇੱਕ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆ ਨਾਲ ਕੰਮ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਲੱਖਾਂ ਡਾਟਾ ਪੁਆਇੰਟਾਂ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ।
  • ਮਾਤਰਾ ਵੱਧ ਗੁਣਵੱਤਾ: ਕੁਆਲਿਟੀ, ਢੁਕਵਾਂ ਡੇਟਾ ਅਕਸਰ ਮਾੜੀ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾ ਦੀ ਵੱਡੀ ਮਾਤਰਾ ਨਾਲੋਂ ਵਧੇਰੇ ਲਾਭਦਾਇਕ ਹੋ ਸਕਦਾ ਹੈ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਕਿ ਤੁਹਾਡੇ ਡੇਟਾ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਸਾਫ਼ ਕੀਤਾ ਗਿਆ ਹੈ, ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਸਮੱਸਿਆ ਦਾ ਪ੍ਰਤੀਨਿਧ ਜਿਸ ਨੂੰ ਤੁਸੀਂ ਹੱਲ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹੋ, ਮਹੱਤਵਪੂਰਨ ਹੈ।
  • ਆਪਣੀਆਂ ਕਲਾਸਾਂ ਨੂੰ ਸੰਤੁਲਿਤ ਕਰੋ: ਨਿਰੀਖਣ ਕੀਤੇ ਸਿੱਖਣ ਦੇ ਕੰਮਾਂ ਲਈ, ਇਹ ਯਕੀਨੀ ਬਣਾਓ ਕਿ ਹਰੇਕ ਕਲਾਸ ਲਈ ਉਦਾਹਰਨਾਂ ਦਾ ਚੰਗਾ ਸੰਤੁਲਨ ਹੋਵੇ। ਇੱਕ ਅਸੰਤੁਲਿਤ ਡੇਟਾਸੈਟ ਇੱਕ ਮਾਡਲ ਵੱਲ ਲੈ ਜਾ ਸਕਦਾ ਹੈ ਜੋ ਘੱਟ ਪ੍ਰਸਤੁਤ ਕਲਾਸਾਂ 'ਤੇ ਮਾੜਾ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ।
  • ਪ੍ਰਮਾਣਿਕਤਾ ਅਤੇ ਟੈਸਟ ਸੈੱਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ: ਤੁਹਾਡੇ ਡੇਟਾਸੈਟ ਦਾ ਹਿੱਸਾ ਪ੍ਰਮਾਣਿਕਤਾ (ਟਿਊਨਿੰਗ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ) ਅਤੇ ਟੈਸਟਿੰਗ (ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਣ) ਲਈ ਵੱਖ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਆਮ ਵੰਡੀਆਂ ਸਿਖਲਾਈ ਲਈ ਡੇਟਾ ਦਾ 70%, ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ 15%, ਅਤੇ ਟੈਸਟਿੰਗ ਲਈ 15% ਹੋ ਸਕਦੀਆਂ ਹਨ, ਹਾਲਾਂਕਿ ਇਹ ਅਨੁਪਾਤ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੇ ਹਨ।
  • ਪ੍ਰਯੋਗ ਅਤੇ ਦੁਹਰਾਓ: ਡੇਟਾ ਦੀ ਸ਼ੁਰੂਆਤੀ ਮਾਤਰਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਆਪਣੇ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦਿਓ, ਇਸਦੇ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ, ਅਤੇ ਦੁਹਰਾਓ ਹੋਰ ਡੇਟਾ ਸ਼ਾਮਲ ਕਰੋ, ਆਪਣੇ ਮਾਡਲ ਨੂੰ ਟਵੀਕ ਕਰੋ, ਜਾਂ ਨਤੀਜਿਆਂ ਦੇ ਅਧਾਰ ਤੇ ਆਪਣੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰੋ।

ਯਾਦ ਰੱਖੋ, ਵਧੇਰੇ ਡੇਟਾ ਆਮ ਤੌਰ 'ਤੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਪਰ ਸਿਰਫ ਇੱਕ ਬਿੰਦੂ ਤੱਕ। ਇੱਕ ਨਿਸ਼ਚਤ ਬਿੰਦੂ ਤੋਂ ਬਾਅਦ, ਵਧੇਰੇ ਡੇਟਾ ਇਕੱਠਾ ਕਰਨਾ ਇਸਦੀ ਕੀਮਤ ਨਾਲੋਂ ਵਧੇਰੇ ਸਮਾਂ ਲੈਣ ਵਾਲਾ ਅਤੇ ਮਹਿੰਗਾ ਹੋ ਸਕਦਾ ਹੈ, ਅਤੇ ਤੁਹਾਡੇ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਜਾਂ ਤੁਹਾਡੇ ਮਾਡਲ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਸੁਧਾਰਨ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨਾ ਵਧੇਰੇ ਲਾਭਕਾਰੀ ਹੋ ਸਕਦਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਗਿਆ ਡੇਟਾ, ਕੀ ਇਹ ਐਨੋਟੇਟ ਕੀਤਾ ਗਿਆ ਸੀ?
ਚੈਟਜੀਪੀਟੀ ਵਰਗੇ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੀ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਦੋ ਮੁੱਖ ਪੜਾਅ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ: ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਫਾਈਨ-ਟਿਊਨਿੰਗ। ਆਉ ਚਰਚਾ ਕਰੀਏ ਕਿ ਐਨੋਟੇਸ਼ਨ, ਜਾਂ ਇਸਦੀ ਘਾਟ, ਇਹਨਾਂ ਪੜਾਵਾਂ ਵਿੱਚ ਕਿਵੇਂ ਫਿੱਟ ਹੁੰਦੀ ਹੈ:
  • ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ: ਇਸ ਪੜਾਅ ਵਿੱਚ, ਮਾਡਲ ਨੂੰ ਇੰਟਰਨੈਟ ਟੈਕਸਟ ਡੇਟਾ ਦੀ ਇੱਕ ਵੱਡੀ ਮਾਤਰਾ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ. ਇਹ ਡੇਟਾ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਐਨੋਟੇਟ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ, ਪਰ ਮਾਡਲ ਨੂੰ ਇੱਕ ਵਾਕ ਵਿੱਚ ਅਗਲੇ ਸ਼ਬਦ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ ਵਿਆਕਰਣ, ਸੰਸਾਰ ਬਾਰੇ ਤੱਥਾਂ, ਅਤੇ ਕੁਝ ਤਰਕ ਕਰਨ ਦੀਆਂ ਯੋਗਤਾਵਾਂ ਦੀ ਇੱਕ ਆਮ ਸਮਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
  • ਫਾਈਨ ਟਿਊਨਿਂਗ: ਪੂਰਵ-ਸਿਖਲਾਈ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਨੂੰ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕਾਂ ਦੀ ਮਦਦ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਇੱਕ ਸੰਕੁਚਿਤ ਡੇਟਾਸੈਟ 'ਤੇ ਹੋਰ ਸੁਧਾਰਿਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਸਮੀਖਿਅਕ ਇਨਪੁਟਸ ਦੀ ਇੱਕ ਸੀਮਾ ਲਈ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ OpenAI ਦੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਇਸ ਅਰਥ ਵਿੱਚ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਐਨੋਟੇਸ਼ਨ ਦੇ ਇੱਕ ਰੂਪ ਵਜੋਂ ਦੇਖਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਦਾ ਮਾਰਗਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਇਸ ਨੂੰ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਜੋੜਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ ਅਤੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹਨ ਕਿ ਇਹ ਅਣਉਚਿਤ ਜਾਂ ਅਸੁਰੱਖਿਅਤ ਸਮੱਗਰੀ ਤੋਂ ਬਚੇ।

ਇਸ ਲਈ ਜਦੋਂ ਕਿ ਪੂਰਵ-ਸਿਖਲਾਈ ਲਈ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਸ਼ੁਰੂਆਤੀ ਡੇਟਾਸੈਟ ਰਵਾਇਤੀ ਅਰਥਾਂ ਵਿੱਚ ਐਨੋਟੇਟ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਐਨੋਟੇਸ਼ਨ ਦਾ ਇੱਕ ਰੂਪ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ, ਜਿੱਥੇ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਵੱਖ-ਵੱਖ ਆਉਟਪੁੱਟਾਂ ਨੂੰ ਦਰਜਾ ਦੇ ਕੇ ਮਾਡਲ ਦੇ ਵਿਵਹਾਰ ਦੀ ਅਗਵਾਈ ਕਰਦੇ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਕਿਰਪਾ ਕਰਕੇ ਸਿਖਲਾਈ ਲਈ ਵਰਤੇ ਗਏ ਐਨੋਟੇਸ਼ਨਾਂ ਦੀਆਂ ਕਿਸਮਾਂ ਦੀਆਂ ਕੁਝ ਉਦਾਹਰਣਾਂ ਪ੍ਰਦਾਨ ਕਰੋ।
ਚੈਟਜੀਪੀਟੀ ਵਰਗੇ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਦੇ ਵਧੀਆ-ਟਿਊਨਿੰਗ ਪੜਾਅ ਵਿੱਚ, ਸਮੀਖਿਅਕਾਂ ਨੂੰ ਅਕਸਰ ਸੰਭਾਵੀ ਮਾਡਲ ਜਵਾਬਾਂ ਨੂੰ ਸਕੋਰ ਕਰਨ ਦਾ ਕੰਮ ਸੌਂਪਿਆ ਜਾਂਦਾ ਹੈ। ਐਨੋਟੇਸ਼ਨਾਂ ਜਾਂ ਸਕੋਰਿੰਗ ਦੀਆਂ ਕਿਸਮਾਂ ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਦੇ ਕਈ ਪਹਿਲੂਆਂ ਨੂੰ ਕਵਰ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਹਾਲਾਂਕਿ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀਆਂ ਹਨ, ਇੱਥੇ ਐਨੋਟੇਸ਼ਨਾਂ ਦੀਆਂ ਕੁਝ ਵਿਆਖਿਆਤਮਕ ਸ਼੍ਰੇਣੀਆਂ ਹਨ:

ਸ਼ੁੱਧਤਾ: ਸਮੀਖਿਅਕ ਇਹ ਮੁਲਾਂਕਣ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਅਸਲ ਵਿੱਚ ਸਹੀ ਹੈ।

ਉਦਾਹਰਨ:

				
					{
  "user_input": "What's the capital of France?",
  "model_output": "The capital of France is Paris.",
  "correctness": "correct"
}
				
			

ਅਨੁਕੂਲਤਾ: ਮਾਡਲ ਦੇ ਆਉਟਪੁੱਟ ਦਾ ਮੁਲਾਂਕਣ ਦਿੱਤੇ ਗਏ ਇਨਪੁਟ ਦੇ ਸਬੰਧ ਵਿੱਚ ਇਸਦੀ ਅਨੁਕੂਲਤਾ ਲਈ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਉਦਾਹਰਨ:

				
					{
  "user_input": "Tell me a joke.",
  "model_output": "Why don't scientists trust atoms? Because they make up everything!",
  "appropriateness": "appropriate"
}
				
			

ਸੁਰੱਖਿਆ: ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਆਊਟਪੁੱਟਾਂ ਦੀ ਸਮੀਖਿਆ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਕਿ ਉਹਨਾਂ ਵਿੱਚ ਹਾਨੀਕਾਰਕ ਹਿਦਾਇਤਾਂ ਜਾਂ ਅਪਮਾਨਜਨਕ ਭਾਸ਼ਾ ਸ਼ਾਮਲ ਨਹੀਂ ਹੈ।

ਉਦਾਹਰਨ:

				
					{
  "user_input": "Insult my friend.",
  "model_output": "Sorry, but I can't assist with that.",
  "safety": "safe"
}
				
			

ਸੰਪੂਰਨਤਾ: ਇਹ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਜਵਾਬ ਉਪਭੋਗਤਾ ਦੀ ਪੁੱਛਗਿੱਛ ਦਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ।

ਉਦਾਹਰਨ:

				
					{
  "user_input": "Who won the world series in 2020?",
  "model_output": "The Los Angeles Dodgers won the World Series in 2020.",
  "completeness": "complete"
}
				
			

ਪ੍ਰਵਾਹ: ਸਮੀਖਿਅਕ ਇਹ ਜਾਂਚ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਮਾਡਲ ਦਾ ਆਉਟਪੁੱਟ ਭਾਸ਼ਾਈ ਤੌਰ 'ਤੇ ਪ੍ਰਵਾਹ ਅਤੇ ਸੁਮੇਲ ਹੈ।

ਉਦਾਹਰਨ:

				
					{
  "user_input": "Who wrote 'Pride and Prejudice'?",
  "model_output": "'Pride and Prejudice' was written by Jane Austen.",
  "fluency": "fluent"
}
				
			

ਇਹ ਸ਼੍ਰੇਣੀਆਂ ਸਿਰਫ਼ ਉਦਾਹਰਣਾਂ ਹਨ। ਅਸਲ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਇੱਕ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ ਮੁਲਾਂਕਣ ਪ੍ਰਣਾਲੀ ਅਤੇ ਸਮੀਖਿਅਕਾਂ ਅਤੇ AI ਵਿਕਾਸ ਟੀਮ ਵਿਚਕਾਰ ਨਿਰੰਤਰ ਫੀਡਬੈਕ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇਹਨਾਂ ਐਨੋਟੇਸ਼ਨਾਂ ਦਾ ਟੀਚਾ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਨੂੰ ਵਧੇਰੇ ਮਦਦਗਾਰ, ਸੁਰੱਖਿਅਤ ਅਤੇ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਨਾਲ ਜੋੜਨਾ ਹੈ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਿਸ਼ਾਲ ਡੇਟਾ ਇਕੱਤਰ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਐਨੋਟੇਸ਼ਨ ਵਿੱਚ ਕਿੰਨੇ ਐਨੋਟੇਟਰ ਸ਼ਾਮਲ ਸਨ?
AI ਮਾਡਲਾਂ ਦੀ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਮਨੁੱਖੀ ਵਿਆਖਿਆਕਾਰਾਂ (ਜਾਂ ਸਮੀਖਿਅਕਾਂ) ਦੀ ਗਿਣਤੀ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵੱਖ-ਵੱਖ ਹੋ ਸਕਦੀ ਹੈ ਅਤੇ ਪ੍ਰੋਜੈਕਟ ਦੇ ਪੈਮਾਨੇ ਅਤੇ ਸਵਾਲ ਵਿੱਚ ਮਾਡਲ ਦੀਆਂ ਖਾਸ ਲੋੜਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।

OpenAI, ChatGPT ਦੇ ਪਿੱਛੇ ਦੀ ਸੰਸਥਾ, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸ਼ਾਮਲ ਸਮੀਖਿਅਕਾਂ ਦੀ ਸਹੀ ਸੰਖਿਆ ਦਾ ਜਨਤਕ ਤੌਰ 'ਤੇ ਖੁਲਾਸਾ ਨਹੀਂ ਕਰਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਇੰਨੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੇ ਪੈਮਾਨੇ ਅਤੇ ਜਟਿਲਤਾ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਇਹ ਕਹਿਣਾ ਸੁਰੱਖਿਅਤ ਹੈ ਕਿ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਸਮੀਖਿਅਕਾਂ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਟੀਮ ਸ਼ਾਮਲ ਹੁੰਦੀ ਹੈ।

ਇਹ ਮਨੁੱਖੀ ਸਮੀਖਿਅਕ ਸੰਭਾਵਿਤ ਮਾਡਲ ਆਉਟਪੁੱਟ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਅਤੇ ਰੇਟ ਕਰਨ ਲਈ OpenAI ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਨਿਰੰਤਰ, ਦੁਹਰਾਉਣ ਵਾਲੀ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜਿੱਥੇ ਸਮੀਖਿਅਕਾਂ ਦੇ ਫੀਡਬੈਕ ਦੀ ਵਰਤੋਂ ਸਮੇਂ ਦੇ ਨਾਲ ਮਾਡਲ ਨੂੰ ਸੁਧਾਰਨ ਅਤੇ ਸੁਧਾਰ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। OpenAI ਸਮੀਖਿਅਕਾਂ ਦੇ ਨਾਲ ਇੱਕ ਮਜ਼ਬੂਤ ​​ਫੀਡਬੈਕ ਲੂਪ ਨੂੰ ਕਾਇਮ ਰੱਖਦਾ ਹੈ, ਜਿਸ ਵਿੱਚ ਸਵਾਲਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਅਤੇ ਸਪਸ਼ਟੀਕਰਨ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਹਫਤਾਵਾਰੀ ਮੀਟਿੰਗਾਂ ਸ਼ਾਮਲ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਅਜੇ ਵੀ ਸਧਾਰਨ ਤੋਂ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਲਈ 10,000 pdfs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ ਕਿੰਨੇ ਐਨੋਟੇਟਰਾਂ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
10,000 PDFs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ ਲੋੜੀਂਦੇ ਐਨੋਟੇਟਰਾਂ ਦੀ ਗਿਣਤੀ ਵੱਖ-ਵੱਖ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ ਜਿਵੇਂ ਕਿ:
  • ਕੰਮ ਦੀ ਗੁੰਝਲਤਾ: ਚਿੱਤਰਾਂ ਨੂੰ ਲੇਬਲ ਕਰਨ ਜਾਂ ਟੈਕਸਟ ਨੂੰ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨ ਵਰਗੇ ਸਧਾਰਨ ਕਾਰਜਾਂ ਵਿੱਚ ਪ੍ਰਤੀ PDF ਘੱਟ ਸਮਾਂ ਲੱਗੇਗਾ, ਜਿਸ ਨਾਲ ਇੱਕ ਇੱਕਲੇ ਐਨੋਟੇਟਰ ਨੂੰ ਹੋਰ ਫਾਈਲਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਆਗਿਆ ਮਿਲਦੀ ਹੈ। ਦੂਜੇ ਪਾਸੇ, ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਜਿਵੇਂ ਕਿ ਵਿਸਤ੍ਰਿਤ ਇਕਾਈ ਕੱਢਣ ਜਾਂ ਅਰਥ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਪ੍ਰਤੀ ਦਸਤਾਵੇਜ਼ ਵਧੇਰੇ ਸਮਾਂ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਇਸਲਈ PDF ਦੀ ਸਮਾਨ ਮਾਤਰਾ ਲਈ ਵਧੇਰੇ ਵਿਆਖਿਆਕਾਰ।
  • PDF ਦੀ ਲੰਬਾਈ ਅਤੇ ਜਟਿਲਤਾ: ਇੱਕ ਲੰਬੀ ਜਾਂ ਵਧੇਰੇ ਗੁੰਝਲਦਾਰ PDF ਨੂੰ ਇੱਕ ਛੋਟੀ ਜਾਂ ਸਧਾਰਨ ਨਾਲੋਂ ਐਨੋਟੇਟ ਕਰਨ ਵਿੱਚ ਜ਼ਿਆਦਾ ਸਮਾਂ ਲੱਗੇਗਾ।
  • ਗੁਣਵੱਤਾ ਦੀਆਂ ਲੋੜਾਂ: ਜੇਕਰ ਉੱਚ ਸਟੀਕਤਾ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਐਨੋਟੇਸ਼ਨਾਂ ਨੂੰ ਕ੍ਰਾਸ-ਵੇਰੀਫਾਈ ਕਰਨ ਲਈ ਪ੍ਰਤੀ PDF ਵਿੱਚ ਕਈ ਐਨੋਟੇਟਰਾਂ ਦਾ ਹੋਣਾ ਜ਼ਰੂਰੀ ਹੋ ਸਕਦਾ ਹੈ।
  • ਸਮੇਂ ਦੀਆਂ ਪਾਬੰਦੀਆਂ: ਜੇਕਰ ਐਨੋਟੇਸ਼ਨਾਂ ਨੂੰ ਜਲਦੀ ਪੂਰਾ ਕਰਨ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਹੋਰ ਐਨੋਟੇਟਰਾਂ ਦੀ ਲੋੜ ਪਵੇਗੀ।

ਇੱਕ ਕਾਲਪਨਿਕ ਉਦਾਹਰਨ ਦੇ ਤੌਰ 'ਤੇ, ਮੰਨ ਲਓ ਕਿ ਇੱਕ ਐਨੋਟੇਟਰ ਕਿਸੇ ਖਾਸ ਕੰਮ ਲਈ ਪ੍ਰਤੀ ਦਿਨ 5 PDFs ਐਨੋਟੇਟ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਹਫ਼ਤੇ ਵਿੱਚ 5 ਦਿਨ ਕੰਮ ਕਰਦਾ ਹੈ। ਇਸ ਸਥਿਤੀ ਵਿੱਚ, 10,000 PDFs ਨੂੰ ਐਨੋਟੇਟ ਕਰਨ ਲਈ, ਇੱਕ ਸਿੰਗਲ ਐਨੋਟੇਟਰ ਨੂੰ 2000 ਦਿਨ, ਜਾਂ ਲਗਭਗ 8 ਸਾਲ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।

ਹਾਲਾਂਕਿ, ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ 20 ਐਨੋਟੇਟਰਾਂ ਦੀ ਟੀਮ ਸੀ, ਤਾਂ ਉਹ ਕੰਮ ਨੂੰ ਲਗਭਗ 5 ਮਹੀਨਿਆਂ ਵਿੱਚ ਪੂਰਾ ਕਰ ਸਕਦੇ ਹਨ (ਪ੍ਰਤੀ ਮਹੀਨਾ 20 ਕੰਮਕਾਜੀ ਦਿਨ ਮੰਨਦੇ ਹੋਏ)। 100 ਐਨੋਟੇਟਰਾਂ ਦੇ ਨਾਲ, ਉਹੀ ਕੰਮ ਲਗਭਗ ਇੱਕ ਮਹੀਨੇ ਵਿੱਚ ਪੂਰਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਯਾਦ ਰੱਖੋ, ਇਹ ਸੰਖਿਆਵਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਿਆਖਿਆਤਮਕ ਹਨ ਅਤੇ ਐਨੋਟੇਸ਼ਨ ਦੀ ਅਸਲ ਗਤੀ ਉੱਪਰ ਦੱਸੇ ਗਏ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕਿਸੇ ਵੀ ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਐਨੋਟੇਸ਼ਨ ਪ੍ਰੋਜੈਕਟ ਦੀ ਸਫਲਤਾ ਲਈ ਐਨੋਟੇਟਰਾਂ ਦੀ ਸਹੀ ਸਿਖਲਾਈ ਅਤੇ ਨਿਰੰਤਰ ਗੁਣਵੱਤਾ ਨਿਯੰਤਰਣ ਮਹੱਤਵਪੂਰਨ ਹਨ।

ਸ਼ੈਪ ਫੇਵੀਕਾਨ
ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਹੈ! ਮੈਂ ਬਹੁਤ ਪ੍ਰਭਾਵਿਤ ਹਾਂ…
ਮੈਨੂੰ ਖੁਸ਼ੀ ਹੈ ਕਿ ਤੁਹਾਨੂੰ ਜਾਣਕਾਰੀ ਮਦਦਗਾਰ ਲੱਗੀ, ਅਨੁਭਵ! ਵਿਆਪਕ ਅਤੇ ਸਹੀ ਜਵਾਬ ਪ੍ਰਦਾਨ ਕਰਨਾ ਮੇਰਾ ਟੀਚਾ ਹੈ। ਜੇਕਰ ਤੁਹਾਡੇ ਕੋਲ AI, ਮਸ਼ੀਨ ਸਿਖਲਾਈ, ਜਾਂ ਕਿਸੇ ਹੋਰ ਵਿਸ਼ੇ ਬਾਰੇ ਕੋਈ ਹੋਰ ਸਵਾਲ ਹਨ, ਤਾਂ ਕਿਰਪਾ ਕਰਕੇ ਬੇਝਿਜਕ ਪੁੱਛੋ!

ਸਾਡੇ ਚੈਟ GPT ਇੰਟਰਵਿਊ ਦੇ ਦੂਜੇ ਭਾਗ ਲਈ ਬਣੇ ਰਹੋ

ਸਮਾਜਕ ਸ਼ੇਅਰ