ਇੱਕ AI ਐਲਗੋਰਿਦਮ ਸਿਰਫ ਓਨਾ ਹੀ ਵਧੀਆ ਹੈ ਜਿੰਨਾ ਡੇਟਾ ਤੁਸੀਂ ਇਸਨੂੰ ਫੀਡ ਕਰਦੇ ਹੋ।
ਇਹ ਨਾ ਤਾਂ ਕੋਈ ਦਲੇਰ ਹੈ ਅਤੇ ਨਾ ਹੀ ਗੈਰ-ਰਵਾਇਤੀ ਬਿਆਨ ਹੈ। AI ਕੁਝ ਦਹਾਕੇ ਪਹਿਲਾਂ ਬਹੁਤ ਦੂਰ ਦੀ ਗੱਲ ਜਾਪਦਾ ਸੀ, ਪਰ ਆਰਟੀਫਿਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਨੇ ਉਦੋਂ ਤੋਂ ਬਹੁਤ ਲੰਬਾ ਸਫ਼ਰ ਤੈਅ ਕੀਤਾ ਹੈ।
ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਕੰਪਿਊਟਰਾਂ ਨੂੰ ਲੇਬਲਾਂ ਅਤੇ ਤਸਵੀਰਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਵਿਆਖਿਆ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਆਪਣੇ ਕੰਪਿਊਟਰ ਨੂੰ ਸਹੀ ਕਿਸਮ ਦੇ ਚਿੱਤਰ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸਿਖਲਾਈ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਵੱਖ-ਵੱਖ ਚਿਹਰੇ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਖੋਜਣ, ਸਮਝਣ ਅਤੇ ਪਛਾਣਨ, ਬਿਮਾਰੀਆਂ ਦਾ ਪਤਾ ਲਗਾਉਣ, ਆਟੋਨੋਮਸ ਵਾਹਨ ਚਲਾਉਣ, ਅਤੇ ਬਹੁ-ਆਯਾਮੀ ਅੰਗ ਸਕੈਨਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਜਾਨਾਂ ਬਚਾਉਣ ਦੀ ਯੋਗਤਾ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹੈ।
ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਮਾਰਕੀਟ ਤੱਕ ਪਹੁੰਚਣ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ ਗਈ ਹੈ 144.46 ਤੱਕ 2028 ਬਿਲੀਅਨ ਡਾਲਰ ਇੱਕ ਨਿਮਰ ਵਿਅਕਤੀ ਤੋਂ 7.04 ਵਿੱਚ $2020 ਬਿਲੀਅਨ, a 'ਤੇ ਵਧ ਰਿਹਾ ਹੈ 45.64 ਅਤੇ 2021 ਵਿਚਕਾਰ 2028% ਦਾ CAGR।
ਤੁਹਾਡੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਕਾਰਜਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਵਾਲਾ ਚਿੱਤਰ ਡੇਟਾਸੈਟ ਤੁਹਾਡੇ AI ਪ੍ਰੋਜੈਕਟ ਦੀ ਸਫਲਤਾ ਲਈ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਇੱਕ ਗੁਣਵੱਤਾ ਵਾਲਾ ਡੇਟਾਸੈਟ ਪ੍ਰਾਪਤ ਕਰਨਾ ਕਾਫ਼ੀ ਮੁਸ਼ਕਲ ਹੈ। ਮਜ਼ਬੂਤ ਮਾਡਲ ਸਿਖਲਾਈ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਦੀ ਜਟਿਲਤਾ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਪ੍ਰਤੀਬਿੰਬਤ ਕਰਨ ਲਈ ਚਿੱਤਰਾਂ ਦੇ ਵਿਭਿੰਨ ਸੰਗ੍ਰਹਿ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਜ਼ਰੂਰੀ ਹੈ।
ਤੁਹਾਡੇ ਪ੍ਰੋਜੈਕਟ ਦੀ ਗੁੰਝਲਤਾ 'ਤੇ ਨਿਰਭਰ ਕਰਦਿਆਂ, ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਦੇ ਉਦੇਸ਼ਾਂ ਲਈ ਭਰੋਸੇਯੋਗ ਅਤੇ ਸੰਬੰਧਿਤ ਡੇਟਾਸੈੱਟ ਪ੍ਰਾਪਤ ਕਰਨ ਵਿੱਚ ਕੁਝ ਦਿਨਾਂ ਤੋਂ ਕੁਝ ਹਫ਼ਤਿਆਂ ਤੱਕ ਦਾ ਸਮਾਂ ਲੱਗ ਸਕਦਾ ਹੈ। ਵੱਖ-ਵੱਖ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਕਾਰਜਾਂ ਅਤੇ ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਡੇਟਾਸੈੱਟਾਂ ਦੀ ਇੱਕ ਵਿਭਿੰਨ ਸ਼੍ਰੇਣੀ ਜ਼ਰੂਰੀ ਹੈ। ਖੋਜਕਰਤਾ ਅਕਸਰ ਵਿਆਪਕ ਮਾਡਲ ਮੁਲਾਂਕਣ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਖੋਜ ਉਦੇਸ਼ਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਡੇਟਾਸੈੱਟ ਦੀ ਮੰਗ ਕਰਦੇ ਹਨ।
ਇੱਥੇ, ਅਸੀਂ ਤੁਹਾਨੂੰ ਓਪਨ-ਸੋਰਸ ਚਿੱਤਰ ਡੇਟਾਸੇਟਾਂ ਦੀ ਇੱਕ ਰੇਂਜ (ਤੁਹਾਡੀ ਆਸਾਨੀ ਲਈ ਸ਼੍ਰੇਣੀਬੱਧ) ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਾਂ ਜੋ ਤੁਸੀਂ ਤੁਰੰਤ ਵਰਤ ਸਕਦੇ ਹੋ।
ਚਿੱਤਰ ਡੇਟਾਸੈੱਟ ਕਾਰਜ: ਵਰਗੀਕਰਨ, ਵਿਭਾਜਨ, ਖੋਜ, ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ
ਚਿੱਤਰ ਡੇਟਾਸੈੱਟ ਇਹ ਆਧੁਨਿਕ ਕੰਪਿਊਟਰ ਦ੍ਰਿਸ਼ਟੀ ਦੀ ਰੀੜ੍ਹ ਦੀ ਹੱਡੀ ਹਨ, ਜੋ ਕਿ ਕਈ ਤਰ੍ਹਾਂ ਦੇ ਕਾਰਜਾਂ ਨੂੰ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ ਜੋ ਮਸ਼ੀਨਾਂ ਨੂੰ ਵਿਜ਼ੂਅਲ ਜਾਣਕਾਰੀ ਦੀ ਵਿਆਖਿਆ ਅਤੇ ਸਮਝਣ ਦੇ ਯੋਗ ਬਣਾਉਂਦੇ ਹਨ। ਭਾਵੇਂ ਤੁਸੀਂ ਆਟੋਨੋਮਸ ਵਾਹਨਾਂ ਲਈ ਇੱਕ ਮਾਡਲ ਬਣਾ ਰਹੇ ਹੋ, ਚਿਹਰੇ ਦੀ ਪਛਾਣ ਤਕਨਾਲੋਜੀ ਵਿਕਸਤ ਕਰ ਰਹੇ ਹੋ, ਜਾਂ ਮੈਡੀਕਲ ਚਿੱਤਰ ਵਿਸ਼ਲੇਸ਼ਣ 'ਤੇ ਕੰਮ ਕਰ ਰਹੇ ਹੋ, ਸਹੀ ਚਿੱਤਰ ਡੇਟਾਸੈਟ ਸਫਲਤਾ ਲਈ ਇੱਕ ਜ਼ਰੂਰੀ ਸਾਧਨ ਹੈ।
ਚਿੱਤਰ ਵਰਗੀਕਰਨ ਇਹ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਦੇ ਸਭ ਤੋਂ ਬੁਨਿਆਦੀ ਕੰਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ, ਇੱਕ ਮਾਡਲ ਇੱਕ ਪੂਰੀ ਤਸਵੀਰ ਨੂੰ ਉਸਦੀ ਸਮੱਗਰੀ ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਲੇਬਲ ਦੇਣਾ ਸਿੱਖਦਾ ਹੈ। ਉਦਾਹਰਣ ਵਜੋਂ, ਇੱਕ ਚਿੱਤਰ ਵਰਗੀਕਰਣ ਡੇਟਾਸੈਟ ਇੱਕ ਮਾਡਲ ਨੂੰ ਬਿੱਲੀਆਂ ਅਤੇ ਕੁੱਤਿਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਵਿੱਚ ਫਰਕ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ, ਜਾਂ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਪੌਦਿਆਂ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਕੰਮ ਆਟੋਮੇਟਿਡ ਫੋਟੋ ਟੈਗਿੰਗ, ਮੈਡੀਕਲ ਤਸਵੀਰਾਂ ਤੋਂ ਬਿਮਾਰੀ ਦਾ ਨਿਦਾਨ, ਅਤੇ ਦ੍ਰਿਸ਼ ਵਰਗੀਕਰਨ ਬੈਂਚਮਾਰਕ ਵਰਗੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹੈ।
ਵਸਤੂ ਖੋਜ ਇਹ ਨਾ ਸਿਰਫ਼ ਇੱਕ ਚਿੱਤਰ ਦੇ ਅੰਦਰ ਵਸਤੂਆਂ ਦੀ ਮੌਜੂਦਗੀ ਦੀ ਪਛਾਣ ਕਰਕੇ, ਸਗੋਂ ਬਾਊਂਡਿੰਗ ਬਾਕਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਹਨਾਂ ਦੇ ਸਥਾਨਾਂ ਨੂੰ ਵੀ ਦਰਸਾਉਂਦੇ ਹੋਏ ਚੀਜ਼ਾਂ ਨੂੰ ਇੱਕ ਕਦਮ ਹੋਰ ਅੱਗੇ ਲੈ ਜਾਂਦਾ ਹੈ। ਵਸਤੂ ਖੋਜ ਲਈ ਡੇਟਾਸੈੱਟ, ਜਿਵੇਂ ਕਿ ਬਾਊਂਡਿੰਗ ਬਾਕਸਾਂ ਵਾਲੀਆਂ ਐਨੋਟੇਟ ਕੀਤੀਆਂ ਤਸਵੀਰਾਂ ਵਾਲੇ, ਆਟੋਨੋਮਸ ਵਾਹਨਾਂ ਵਿੱਚ ਪੈਦਲ ਯਾਤਰੀਆਂ ਦੀ ਖੋਜ, ਸੁਰੱਖਿਆ ਨਿਗਰਾਨੀ ਅਤੇ ਪ੍ਰਚੂਨ ਵਿਸ਼ਲੇਸ਼ਣ ਵਰਗੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ ਹਨ। ਅਸਲ-ਸੰਸਾਰ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਲਈ ਮਜ਼ਬੂਤ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਐਲਗੋਰਿਦਮ ਵਿਕਸਤ ਕਰਨ ਵਿੱਚ ਵਸਤੂ ਖੋਜ ਵੀ ਇੱਕ ਮੁੱਖ ਹਿੱਸਾ ਹੈ।
ਅਰਥ ਵਿਭਾਜਨ ਇਸ ਵਿੱਚ ਇੱਕ ਚਿੱਤਰ ਦੇ ਹਰੇਕ ਪਿਕਸਲ ਨੂੰ ਇੱਕ ਖਾਸ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ, ਜੋ ਦ੍ਰਿਸ਼ ਦੀ ਵਿਸਤ੍ਰਿਤ ਸਮਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਇਹ ਪਿਕਸਲ-ਪੱਧਰੀ ਟ੍ਰਾਈਮੈਪ ਸੈਗਮੈਂਟੇਸ਼ਨ ਖਾਸ ਤੌਰ 'ਤੇ ਮੈਡੀਕਲ ਇਮੇਜਿੰਗ ਵਰਗੇ ਕੰਮਾਂ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਹੈ, ਜਿੱਥੇ ਅੰਗਾਂ ਜਾਂ ਟਿਊਮਰਾਂ ਦੀ ਸਹੀ ਰੇਖਾ-ਚਿੱਤਰਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਅਤੇ ਸ਼ਹਿਰੀ ਵਾਤਾਵਰਣ ਵਿੱਚ ਆਟੋਨੋਮਸ ਡਰਾਈਵਿੰਗ ਲਈ, ਜਿੱਥੇ ਸੜਕਾਂ, ਫੁੱਟਪਾਥਾਂ ਅਤੇ ਵਾਹਨਾਂ ਵਿੱਚ ਫਰਕ ਕਰਨਾ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦਾ ਹੈ।
ਇਹਨਾਂ ਮੁੱਖ ਕਾਰਜਾਂ ਤੋਂ ਇਲਾਵਾ, ਚਿੱਤਰ ਡੇਟਾਸੈੱਟ ਉਦਾਹਰਣ ਵਿਭਾਜਨ (ਇੱਕੋ ਸ਼੍ਰੇਣੀ ਦੇ ਵਿਅਕਤੀਗਤ ਵਸਤੂਆਂ ਵਿੱਚ ਅੰਤਰ), ਚਿੱਤਰ ਕੈਪਸ਼ਨਿੰਗ (ਚਿੱਤਰਾਂ ਲਈ ਵਰਣਨਯੋਗ ਟੈਕਸਟ ਤਿਆਰ ਕਰਨਾ), ਅਤੇ ਚਿਹਰੇ ਦੀ ਪਛਾਣ (ਚਿੱਤਰਾਂ ਵਿੱਚ ਮਨੁੱਖੀ ਚਿਹਰਿਆਂ ਦੀ ਪਛਾਣ ਜਾਂ ਪੁਸ਼ਟੀ ਕਰਨਾ) ਦਾ ਵੀ ਸਮਰਥਨ ਕਰਦੇ ਹਨ। ਇਹਨਾਂ ਵਿੱਚੋਂ ਹਰੇਕ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਕਾਰਜ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਪ੍ਰਮਾਣਿਤ ਕਰਨ ਲਈ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ, ਐਨੋਟੇਟਡ ਚਿੱਤਰਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।
ਵਿਭਿੰਨ ਅਤੇ ਚੰਗੀ ਤਰ੍ਹਾਂ ਵਿਆਖਿਆ ਕੀਤੇ ਚਿੱਤਰ ਡੇਟਾਸੈਟਾਂ ਦਾ ਲਾਭ ਉਠਾ ਕੇ, ਡੇਟਾ ਵਿਗਿਆਨੀ ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਪ੍ਰੈਕਟੀਸ਼ਨਰ ਕਈ ਤਰ੍ਹਾਂ ਦੀਆਂ ਕੰਪਿਊਟਰ ਦ੍ਰਿਸ਼ਟੀ ਚੁਣੌਤੀਆਂ ਨਾਲ ਨਜਿੱਠ ਸਕਦੇ ਹਨ, ਚਿੱਤਰ ਪਛਾਣ ਅਤੇ ਵਰਗੀਕਰਨ ਕਾਰਜਾਂ ਤੋਂ ਲੈ ਕੇ ਗੁੰਝਲਦਾਰ ਵਿਭਾਜਨ ਅਤੇ ਖੋਜ ਸਮੱਸਿਆਵਾਂ ਤੱਕ। ਸਹੀ ਡੇਟਾਸੈਟ ਨਾ ਸਿਰਫ਼ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਨੂੰ ਤੇਜ਼ ਕਰਦਾ ਹੈ ਬਲਕਿ ਇਹ ਵੀ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਕੰਪਿਊਟਰ ਦ੍ਰਿਸ਼ਟੀ ਪ੍ਰਣਾਲੀਆਂ ਅਸਲ-ਸੰਸਾਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਸਹੀ ਢੰਗ ਨਾਲ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੀਆਂ ਹਨ।
ਤੁਹਾਡੇ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਚਿੱਤਰ ਡੇਟਾਸੇਟਾਂ ਦੀ ਵਿਆਪਕ ਸੂਚੀ
ਜਨਰਲ:
-
ਚਿੱਤਰਨੈੱਟ
ਇਮੇਜਨੈੱਟ ਇੱਕ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਡੇਟਾਸੈਟ ਹੈ, ਅਤੇ ਇਹ 1.2 ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤੇ ਗਏ 1000 ਮਿਲੀਅਨ ਚਿੱਤਰਾਂ ਦੇ ਨਾਲ ਆਉਂਦਾ ਹੈ। ਇਹ ਡੇਟਾਸੈਟ ਵਰਲਡਨੈੱਟ ਲੜੀ ਦੇ ਅਨੁਸਾਰ ਸੰਗਠਿਤ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਤਿੰਨ ਭਾਗਾਂ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤਾ ਗਿਆ ਹੈ - ਸਿਖਲਾਈ ਡੇਟਾ, ਚਿੱਤਰ ਲੇਬਲ, ਅਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਡੇਟਾ।
-
ਕੀਨੇਟਿਕਸ 700
ਕਾਇਨੇਟਿਕਸ 700 650,000 ਵੱਖ-ਵੱਖ ਮਨੁੱਖੀ ਐਕਸ਼ਨ ਕਲਾਸਾਂ ਦੇ 700 ਤੋਂ ਵੱਧ ਕਲਿੱਪਾਂ ਵਾਲਾ ਇੱਕ ਵਿਸ਼ਾਲ ਉੱਚ-ਗੁਣਵੱਤਾ ਡੇਟਾਸੈਟ ਹੈ। ਹਰੇਕ ਕਲਾਸ ਐਕਸ਼ਨ ਵਿੱਚ ਲਗਭਗ 700 ਵੀਡੀਓ ਕਲਿੱਪ ਹਨ। ਡੇਟਾਸੈਟ ਵਿੱਚ ਕਲਿੱਪਾਂ ਵਿੱਚ ਮਨੁੱਖੀ-ਵਸਤੂ ਅਤੇ ਮਨੁੱਖੀ-ਮਨੁੱਖੀ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਹਨ, ਜੋ ਵੀਡੀਓਜ਼ ਵਿੱਚ ਮਨੁੱਖੀ ਕਿਰਿਆਵਾਂ ਨੂੰ ਪਛਾਣਨ ਵੇਲੇ ਕਾਫ਼ੀ ਮਦਦਗਾਰ ਸਾਬਤ ਹੋ ਰਹੀਆਂ ਹਨ।
-
CIFAR-10
CIFAR 10 ਸਭ ਤੋਂ ਵੱਡੇ ਕੰਪਿਊਟਰ-ਵਿਜ਼ਨ ਡੇਟਾਸੈਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ ਜੋ ਦਸ ਵੱਖ-ਵੱਖ ਸ਼੍ਰੇਣੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦੇ 60000 32 x 32 ਰੰਗ ਚਿੱਤਰਾਂ ਦਾ ਮਾਣ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਕਲਾਸ ਵਿੱਚ ਲਗਭਗ 6000 ਚਿੱਤਰ ਹਨ ਜੋ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਐਲਗੋਰਿਦਮ ਅਤੇ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ।
-
ਆਕਸਫੋਰਡ-IIIT ਪੇਟ ਚਿੱਤਰ ਡੇਟਾਸੈਟ
ਪਾਲਤੂ ਚਿੱਤਰ ਡੇਟਾਸੇਟ ਵਿੱਚ ਪ੍ਰਤੀ ਕਲਾਸ 37 ਚਿੱਤਰਾਂ ਦੇ ਨਾਲ 200 ਸ਼੍ਰੇਣੀਆਂ ਸ਼ਾਮਲ ਹਨ। ਇਹ ਚਿੱਤਰ ਪੈਮਾਨੇ, ਪੋਜ਼ ਅਤੇ ਰੋਸ਼ਨੀ ਵਿੱਚ ਵੱਖੋ-ਵੱਖਰੇ ਹੁੰਦੇ ਹਨ, ਅਤੇ ਨਸਲ, ਸਿਰ ROI, ਅਤੇ ਪਿਕਸਲ-ਪੱਧਰ ਦੇ ਟ੍ਰਿਮੈਪ ਸੈਗਮੈਂਟੇਸ਼ਨ ਲਈ ਐਨੋਟੇਸ਼ਨਾਂ ਦੇ ਨਾਲ ਹੁੰਦੇ ਹਨ।
-
ਗੂਗਲ ਦੇ ਓਪਨ ਚਿੱਤਰ
ਇੱਕ ਪ੍ਰਭਾਵਸ਼ਾਲੀ 9 ਮਿਲੀਅਨ URL ਦੇ ਨਾਲ, ਇਹ ਸੂਚੀ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੇ ਚਿੱਤਰ ਡੇਟਾਸੈਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ, ਜਿਸ ਵਿੱਚ 6,000 ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਲੇਬਲ ਕੀਤੇ ਲੱਖਾਂ ਚਿੱਤਰ ਹਨ।
-
ਪੌਦੇ ਦੀਆਂ ਤਸਵੀਰਾਂ
ਇਸ ਸੰਕਲਨ ਵਿੱਚ ਲਗਭਗ 1 ਸਪੀਸੀਜ਼ ਨੂੰ ਕਵਰ ਕਰਦੇ ਹੋਏ, ਪ੍ਰਭਾਵਸ਼ਾਲੀ 11 ਮਿਲੀਅਨ ਪੌਦਿਆਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਦੀ ਵਿਸ਼ੇਸ਼ਤਾ ਵਾਲੇ ਮਲਟੀਪਲ ਚਿੱਤਰ ਡੇਟਾਸੇਟਸ ਸ਼ਾਮਲ ਹਨ।
-
LSUN
LSUN ਇੱਕ ਵੱਡੇ ਪੈਮਾਨੇ ਦਾ ਚਿੱਤਰ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਦ੍ਰਿਸ਼ ਅਤੇ ਵਸਤੂ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਲੱਖਾਂ ਲੇਬਲ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਹਨ। ਡੇਟਾਸੈਟ ਵਿੱਚ ਮਾਡਲ ਮੁਲਾਂਕਣ ਲਈ ਇੱਕ ਸਮਰਪਿਤ ਟੈਸਟ ਸੈੱਟ ਸ਼ਾਮਲ ਹੈ।
ਚਿਹਰੇ ਦੀ ਪਛਾਣ:

-
ਜੰਗਲੀ ਵਿੱਚ ਲੇਬਲ ਕੀਤੇ ਚਿਹਰੇ
ਲੇਬਲਡ ਫੇਸਡ ਇਨ ਦ ਵਾਈਲਡ ਇੱਕ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ ਵਿੱਚ ਇੰਟਰਨੈਟ ਤੋਂ ਖੋਜੇ ਗਏ ਲਗਭਗ 13,230 ਲੋਕਾਂ ਦੀਆਂ 5,750 ਤੋਂ ਵੱਧ ਤਸਵੀਰਾਂ ਹਨ। ਚਿਹਰਿਆਂ ਦਾ ਇਹ ਡੇਟਾਸੈਟ ਬੇਰੋਕ ਚਿਹਰੇ ਦੀ ਪਛਾਣ ਦਾ ਅਧਿਐਨ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਣ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।
-
CASIA ਵੈੱਬਫੇਸ
CASIA ਵੈੱਬ ਫੇਸ ਇੱਕ ਚੰਗੀ ਤਰ੍ਹਾਂ ਡਿਜ਼ਾਇਨ ਕੀਤਾ ਡਾਟਾਸੈੱਟ ਹੈ ਜੋ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਬੇਰੋਕ ਚਿਹਰੇ ਦੀ ਪਛਾਣ 'ਤੇ ਵਿਗਿਆਨਕ ਖੋਜ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਲਗਭਗ 494,000 ਅਸਲ ਪਛਾਣਾਂ ਦੀਆਂ 10,000 ਤੋਂ ਵੱਧ ਤਸਵੀਰਾਂ ਦੇ ਨਾਲ, ਇਹ ਚਿਹਰੇ ਦੀ ਪਛਾਣ ਅਤੇ ਪੁਸ਼ਟੀਕਰਨ ਕਾਰਜਾਂ ਲਈ ਆਦਰਸ਼ ਹੈ।
-
UMD ਫੇਸ ਡੇਟਾਸੈਟ
UMD ਇੱਕ ਚੰਗੀ ਤਰ੍ਹਾਂ ਐਨੋਟੇਟਿਡ ਡੇਟਾਸੇਟ ਦਾ ਸਾਹਮਣਾ ਕਰਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਦੋ ਭਾਗ ਹੁੰਦੇ ਹਨ - ਸਥਿਰ ਚਿੱਤਰ ਅਤੇ ਵੀਡੀਓ ਫਰੇਮ। ਡੇਟਾਸੇਟ ਵਿੱਚ 367,800 ਤੋਂ ਵੱਧ ਫੇਸ ਐਨੋਟੇਸ਼ਨ ਅਤੇ ਵਿਸ਼ਿਆਂ ਦੇ 3.7 ਮਿਲੀਅਨ ਐਨੋਟੇਟਿਡ ਵੀਡੀਓ ਫਰੇਮ ਹਨ।
-
ਫੇਸ ਮਾਸਕ ਖੋਜ
ਇਸ ਡੇਟਾਸੈਟ ਵਿੱਚ 853 ਚਿੱਤਰਾਂ ਨੂੰ ਤਿੰਨ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕੀਤਾ ਗਿਆ ਹੈ: “ਮਾਸਕ ਦੇ ਨਾਲ,” “ਬਿਨਾਂ ਮਾਸਕ,” ਅਤੇ “ਗਲਤ ਢੰਗ ਨਾਲ ਪਹਿਨਿਆ ਗਿਆ ਮਾਸਕ”, PASCAL VOC ਫਾਰਮੈਟ ਵਿੱਚ ਉਹਨਾਂ ਦੇ ਬਾਊਂਡਿੰਗ ਬਾਕਸਾਂ ਦੇ ਨਾਲ।
-
FERET
FERET (ਚਿਹਰੇ ਦੀ ਪਛਾਣ ਤਕਨਾਲੋਜੀ ਡੇਟਾਬੇਸ) ਇੱਕ ਵਿਆਪਕ ਚਿੱਤਰ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ ਵਿੱਚ ਮਨੁੱਖੀ ਚਿਹਰਿਆਂ ਦੀਆਂ 14,000 ਤੋਂ ਵੱਧ ਵਿਆਖਿਆ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਹਨ।
ਹੱਥ ਲਿਖਤ ਪਛਾਣ:
-
MNIST ਡਾਟਾਬੇਸ
MNIST ਇੱਕ ਡੇਟਾਬੇਸ ਹੈ ਜਿਸ ਵਿੱਚ 0 ਤੋਂ 9 ਤੱਕ ਹੱਥ ਲਿਖਤ ਅੰਕਾਂ ਦੇ ਨਮੂਨੇ ਹਨ, ਅਤੇ ਇਸ ਵਿੱਚ 60,000 ਅਤੇ 10,000 ਸਿਖਲਾਈ ਅਤੇ ਜਾਂਚ ਚਿੱਤਰ ਹਨ। 1999 ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਗਿਆ, MNIST ਡੀਪ ਲਰਨਿੰਗ ਵਿੱਚ ਚਿੱਤਰ ਪ੍ਰੋਸੈਸਿੰਗ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਜਾਂਚ ਕਰਨਾ ਆਸਾਨ ਬਣਾਉਂਦਾ ਹੈ।
-
ਨਕਲੀ ਅੱਖਰ ਡਾਟਾਸੈੱਟ
ਨਕਲੀ ਅੱਖਰ ਡੇਟਾਸੈਟ, ਜਿਵੇਂ ਕਿ ਨਾਮ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ, ਨਕਲੀ ਤੌਰ 'ਤੇ ਤਿਆਰ ਕੀਤਾ ਡੇਟਾ ਹੈ ਜੋ ਦਸ ਵੱਡੇ ਅੱਖਰਾਂ ਵਿੱਚ ਅੰਗਰੇਜ਼ੀ ਭਾਸ਼ਾ ਦੀ ਬਣਤਰ ਦਾ ਵਰਣਨ ਕਰਦਾ ਹੈ। ਇਹ 6000 ਤੋਂ ਵੱਧ ਚਿੱਤਰਾਂ ਦੇ ਨਾਲ ਆਉਂਦਾ ਹੈ।
ਵਸਤੂ ਖੋਜ:
MS COCO
MS COCO ਜਾਂ ਸੰਦਰਭ ਵਿੱਚ ਆਮ ਵਸਤੂਆਂ ਇੱਕ ਵਸਤੂ ਖੋਜ ਅਤੇ ਕੈਪਸ਼ਨਿੰਗ ਡੇਟਾਸੈਟ ਹੈ।
ਇਸ ਵਿੱਚ ਕੀਪੁਆਇੰਟ ਖੋਜ, ਮਲਟੀ-ਆਬਜੈਕਟ ਖੋਜ, ਕੈਪਸ਼ਨਿੰਗ, ਅਤੇ ਸੈਗਮੈਂਟੇਸ਼ਨ ਮਾਸਕ ਐਨੋਟੇਸ਼ਨ ਦੇ ਨਾਲ 328,000 ਤੋਂ ਵੱਧ ਚਿੱਤਰ ਹਨ। ਇਹ 80 ਵਸਤੂ ਸ਼੍ਰੇਣੀਆਂ ਅਤੇ ਪ੍ਰਤੀ ਚਿੱਤਰ ਪੰਜ ਸੁਰਖੀਆਂ ਦੇ ਨਾਲ ਆਉਂਦਾ ਹੈ।
LSUN
LSUN, ਵੱਡੇ ਪੈਮਾਨੇ ਦੇ ਦ੍ਰਿਸ਼ ਸਮਝ ਲਈ ਛੋਟਾ, ਕੋਲ 20 ਵਸਤੂਆਂ ਅਤੇ 10 ਦ੍ਰਿਸ਼ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਇੱਕ ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਲੇਬਲ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਹਨ। ਕੁਝ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ 300,000 ਦੇ ਕਰੀਬ ਚਿੱਤਰ ਹਨ, ਖਾਸ ਤੌਰ 'ਤੇ ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ 300 ਚਿੱਤਰਾਂ ਅਤੇ ਟੈਸਟ ਡੇਟਾ ਲਈ 1000 ਚਿੱਤਰਾਂ ਦੇ ਨਾਲ।
ਘਰੇਲੂ ਵਸਤੂਆਂ
ਹੋਮ ਆਬਜੈਕਟਸ ਡੇਟਾਸੈਟ ਵਿੱਚ ਘਰ ਦੇ ਆਲੇ ਦੁਆਲੇ ਦੀਆਂ ਬੇਤਰਤੀਬ ਵਸਤੂਆਂ ਦੀਆਂ ਐਨੋਟੇਟ ਕੀਤੀਆਂ ਤਸਵੀਰਾਂ ਸ਼ਾਮਲ ਹੁੰਦੀਆਂ ਹਨ - ਰਸੋਈ, ਲਿਵਿੰਗ ਰੂਮ ਅਤੇ ਬਾਥਰੂਮ। ਇਸ ਡੇਟਾਸੈਟ ਵਿੱਚ ਕੁਝ ਐਨੋਟੇਟਿਡ ਵਿਡੀਓਜ਼ ਅਤੇ 398 ਅਨਨੋਟੇਟਿਡ ਫੋਟੋਆਂ ਵੀ ਹਨ ਜੋ ਜਾਂਚ ਲਈ ਤਿਆਰ ਕੀਤੀਆਂ ਗਈਆਂ ਹਨ।
ਵਿਜ਼ੂਅਲ ਜੀਨੋਮ
ਵਿਜ਼ੂਅਲ ਜੀਨੋਮ ਇੱਕ ਵਿਆਪਕ ਵਿਜ਼ੂਅਲ ਗਿਆਨ ਅਧਾਰ ਹੈ ਜਿਸ ਵਿੱਚ 108,000 ਤੋਂ ਵੱਧ ਕੈਪਸ਼ਨ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਹਨ। ਇਹ ਵਸਤੂਆਂ, ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਸਬੰਧਾਂ ਲਈ ਵਿਆਪਕ ਐਨੋਟੇਸ਼ਨ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜੋ ਇਸਨੂੰ ਵਸਤੂ ਪਛਾਣ, ਚਿੱਤਰ ਕੈਪਸ਼ਨਿੰਗ, ਅਤੇ ਮਲਟੀਮੋਡਲ ਸਿਖਲਾਈ ਕਾਰਜਾਂ ਲਈ ਕੀਮਤੀ ਬਣਾਉਂਦਾ ਹੈ।
ਆਟੋਮੋਟਿਵ:
ਸਿਟੀਸਕੇਪ ਡੇਟਾਸੈਟ
ਸਿਟੀਸਕੇਪ ਉਹ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ 'ਤੇ ਜਾਣਾ ਹੈ ਜਦੋਂ ਕਈ ਹਵਾਲਿਆਂ ਦੇ ਗਲੀ ਦੇ ਦ੍ਰਿਸ਼ਾਂ ਤੋਂ ਰਿਕਾਰਡ ਕੀਤੇ ਵੱਖ-ਵੱਖ ਵੀਡੀਓ ਕ੍ਰਮਾਂ ਦੀ ਖੋਜ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਇਹ ਤਸਵੀਰਾਂ ਲੰਬੇ ਸਮੇਂ ਅਤੇ ਵੱਖ-ਵੱਖ ਮੌਸਮ ਅਤੇ ਰੌਸ਼ਨੀ ਦੀਆਂ ਸਥਿਤੀਆਂ ਵਿੱਚ ਕੈਪਚਰ ਕੀਤੀਆਂ ਗਈਆਂ ਸਨ। ਐਨੋਟੇਸ਼ਨ ਅੱਠ ਵੱਖ-ਵੱਖ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਵੰਡੀਆਂ ਤਸਵੀਰਾਂ ਦੀਆਂ 30 ਸ਼੍ਰੇਣੀਆਂ ਲਈ ਹਨ।
ਬਾਰਕਲੇ ਡੀਪ ਡਰਾਈਵ
Barkley DeepDrive ਖਾਸ ਤੌਰ 'ਤੇ ਆਟੋਨੋਮਸ ਵਾਹਨ ਸਿਖਲਾਈ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ, ਅਤੇ ਇਸ ਵਿੱਚ 100 ਹਜ਼ਾਰ ਤੋਂ ਵੱਧ ਐਨੋਟੇਟਿਡ ਵੀਡੀਓ ਕ੍ਰਮ ਹਨ। ਇਹ ਬਦਲਦੀਆਂ ਸੜਕਾਂ ਅਤੇ ਡਰਾਈਵਿੰਗ ਹਾਲਤਾਂ ਦੁਆਰਾ ਆਟੋਨੋਮਸ ਵਾਹਨਾਂ ਲਈ ਸਭ ਤੋਂ ਮਦਦਗਾਰ ਸਿਖਲਾਈ ਡੇਟਾ ਵਿੱਚੋਂ ਇੱਕ ਹੈ।
ਮੈਪਿਲਰੀ
ਮੈਪਿਲਰੀ ਵਿੱਚ ਦੁਨੀਆ ਭਰ ਵਿੱਚ 750 ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਸਟ੍ਰੀਟ ਸੀਨ ਅਤੇ ਟ੍ਰੈਫਿਕ ਚਿੰਨ੍ਹ ਹਨ, ਜੋ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਅਤੇ AI ਐਲਗੋਰਿਦਮ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਧਾਰਨਾ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਵਿੱਚ ਬਹੁਤ ਉਪਯੋਗੀ ਹਨ। ਇਹ ਤੁਹਾਨੂੰ ਖੁਦਮੁਖਤਿਆਰੀ ਵਾਹਨਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਰੋਸ਼ਨੀ ਅਤੇ ਮੌਸਮ ਦੀਆਂ ਸਥਿਤੀਆਂ ਅਤੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦੇ ਹਨ।
ਮੈਡੀਕਲ ਇਮੇਜਿੰਗ:
ਕੋਵਿਡ-19 ਓਪਨ ਰਿਸਰਚ ਡੇਟਾਸੈਟ
ਇਸ ਮੂਲ ਡੇਟਾਸੈਟ ਵਿੱਚ AP/PA ਛਾਤੀ ਦੇ ਐਕਸ-ਰੇ ਬਾਰੇ ਲਗਭਗ 6500 ਪਿਕਸਲ-ਪੌਲੀਗੋਨਲ ਫੇਫੜੇ ਦੇ ਖੰਡ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਕੋਵਿਡ-517 ਮਰੀਜ਼ ਦੇ ਐਕਸ-ਰੇ ਦੇ 19 ਚਿੱਤਰ, ਨਾਮ, ਸਥਾਨ, ਦਾਖਲਾ ਵੇਰਵਿਆਂ, ਨਤੀਜਾ ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਵਾਲੇ ਟੈਗਸ ਦੇ ਨਾਲ ਉਪਲਬਧ ਹਨ।
100,000 ਛਾਤੀ ਦੇ ਐਕਸ-ਰੇ ਦਾ NIH ਡਾਟਾਬੇਸ
NIH ਡੇਟਾਬੇਸ ਸਭ ਤੋਂ ਵਿਆਪਕ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਡੇਟਾਸੈਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ ਜਿਸ ਵਿੱਚ 100,000 ਛਾਤੀ ਦੇ ਐਕਸ-ਰੇ ਚਿੱਤਰ ਅਤੇ ਸੰਬੰਧਿਤ ਡੇਟਾ ਵਿਗਿਆਨਕ ਅਤੇ ਖੋਜ ਭਾਈਚਾਰੇ ਲਈ ਉਪਯੋਗੀ ਹਨ। ਇਸ ਵਿੱਚ ਫੇਫੜਿਆਂ ਦੀਆਂ ਬਿਮਾਰੀਆਂ ਵਾਲੇ ਮਰੀਜ਼ਾਂ ਦੀਆਂ ਤਸਵੀਰਾਂ ਵੀ ਹਨ।
ਡਿਜੀਟਲ ਪੈਥੋਲੋਜੀ ਦਾ ਐਟਲਸ
ਡਿਜੀਟਲ ਪੈਥੋਲੋਜੀ ਦਾ ਐਟਲਸ ਵੱਖ-ਵੱਖ ਅੰਗਾਂ ਦੀਆਂ 17,000 ਐਨੋਟੇਟਿਡ ਸਲਾਈਡਾਂ ਤੋਂ, ਕੁੱਲ ਮਿਲਾ ਕੇ 100 ਤੋਂ ਵੱਧ, ਕਈ ਹਿਸਟੋਪੈਥੋਲੋਜੀਕਲ ਪੈਚ ਚਿੱਤਰ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਇਹ ਡੇਟਾਸੈਟ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਅਤੇ ਪੈਟਰਨ ਪਛਾਣ ਸਾਫਟਵੇਅਰ ਵਿਕਸਿਤ ਕਰਨ ਵਿੱਚ ਉਪਯੋਗੀ ਹੈ।
ਦ੍ਰਿਸ਼ ਦੀ ਪਛਾਣ:

ਅੰਦਰੂਨੀ ਦ੍ਰਿਸ਼ ਦੀ ਪਛਾਣ
ਇਨਡੋਰ ਸੀਨ ਰਿਕਗਨੀਸ਼ਨ ਇੱਕ ਉੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ ਵਿੱਚ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਅਤੇ ਡੇਟਾ ਸਿਖਲਾਈ ਵਿੱਚ ਵਰਤੇ ਜਾਣ ਵਾਲੀਆਂ ਵਸਤੂਆਂ ਅਤੇ ਅੰਦਰੂਨੀ ਦ੍ਰਿਸ਼ਾਂ ਦੀਆਂ ਲਗਭਗ 15620 ਤਸਵੀਰਾਂ ਹਨ। ਇਹ 65 ਤੋਂ ਵੱਧ ਸ਼੍ਰੇਣੀਆਂ ਦੇ ਨਾਲ ਆਉਂਦਾ ਹੈ, ਅਤੇ ਹਰੇਕ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ 100 ਚਿੱਤਰ ਹੁੰਦੇ ਹਨ।
xView
ਸਭ ਤੋਂ ਮਸ਼ਹੂਰ ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਡੇਟਾਸੈਟਾਂ ਵਿੱਚੋਂ ਇੱਕ ਵਜੋਂ, xView ਵਿੱਚ ਵੱਖ-ਵੱਖ ਗੁੰਝਲਦਾਰ ਅਤੇ ਵੱਡੇ ਦ੍ਰਿਸ਼ਾਂ ਤੋਂ ਐਨੋਟੇਟਿਡ ਓਵਰਹੈੱਡ ਇਮੇਜਰੀ ਸ਼ਾਮਲ ਹਨ। ਲਗਭਗ 60 ਕਲਾਸਾਂ ਅਤੇ ਇੱਕ ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਵਸਤੂ ਉਦਾਹਰਨਾਂ ਦੇ ਨਾਲ, ਇਸ ਡੇਟਾਸੈਟ ਦਾ ਉਦੇਸ਼ ਸੈਟੇਲਾਈਟ ਚਿੱਤਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਿਹਤਰ ਆਫ਼ਤ ਰਾਹਤ ਪ੍ਰਦਾਨ ਕਰਨਾ ਹੈ।
ਸਥਾਨ
ਸਥਾਨ, MIT ਦੁਆਰਾ ਯੋਗਦਾਨ ਪਾਇਆ ਗਿਆ ਇੱਕ ਡੇਟਾਸੈਟ, ਵਿੱਚ 1.8 ਵੱਖ-ਵੱਖ ਦ੍ਰਿਸ਼ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚੋਂ 365 ਮਿਲੀਅਨ ਤੋਂ ਵੱਧ ਚਿੱਤਰ ਹਨ। ਪ੍ਰਮਾਣਿਕਤਾ ਲਈ ਇਹਨਾਂ ਵਿੱਚੋਂ ਹਰੇਕ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਲਗਭਗ 50 ਚਿੱਤਰ ਅਤੇ ਜਾਂਚ ਲਈ 900 ਚਿੱਤਰ ਹਨ। ਦ੍ਰਿਸ਼ ਪਛਾਣ ਜਾਂ ਵਿਜ਼ੂਅਲ ਪਛਾਣ ਕਾਰਜਾਂ ਨੂੰ ਸਥਾਪਤ ਕਰਨ ਲਈ ਡੂੰਘੇ ਦ੍ਰਿਸ਼ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਿੱਖਣਾ ਸੰਭਵ ਹੈ।
SUN ਡੇਟਾਬੇਸ
SUN ਡੇਟਾਬੇਸ ਇੱਕ ਵਿਆਪਕ ਦ੍ਰਿਸ਼ ਵਰਗੀਕਰਨ ਬੈਂਚਮਾਰਕ ਹੈ ਜੋ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਵਿੱਚ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਹਜ਼ਾਰਾਂ ਤਸਵੀਰਾਂ ਹਨ ਜੋ ਅੰਦਰੂਨੀ ਅਤੇ ਬਾਹਰੀ ਵਾਤਾਵਰਣਾਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਫੈਲੀਆਂ ਹੋਈਆਂ ਹਨ, ਹਰੇਕ ਦ੍ਰਿਸ਼ ਲਈ ਵਿਸਤ੍ਰਿਤ ਐਨੋਟੇਸ਼ਨਾਂ ਦੇ ਨਾਲ। SUN ਡੇਟਾਬੇਸ ਵੱਖ-ਵੱਖ ਦ੍ਰਿਸ਼ਾਂ ਦੀ ਕਵਰੇਜ ਲਈ ਮਾਨਤਾ ਪ੍ਰਾਪਤ ਹੈ ਅਤੇ ਦ੍ਰਿਸ਼ ਸਮਝ ਐਲਗੋਰਿਦਮ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਇੱਕ ਮਿਆਰੀ ਸੰਦਰਭ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ।
ਮਨੋਰੰਜਨ:
IMDB WIKI ਡੇਟਾਸੈਟ
IMDB - ਵਿਕੀ ਉਮਰ, ਲਿੰਗ ਅਤੇ ਨਾਵਾਂ ਦੇ ਨਾਲ ਲੇਬਲ ਕੀਤੇ ਚਿਹਰਿਆਂ ਦੇ ਸਭ ਤੋਂ ਪ੍ਰਸਿੱਧ ਜਨਤਕ ਡੇਟਾਬੇਸ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਇਸ ਵਿੱਚ ਮਸ਼ਹੂਰ ਹਸਤੀਆਂ ਦੇ ਲਗਭਗ 20 ਹਜ਼ਾਰ ਚਿਹਰੇ ਅਤੇ ਵਿਕੀਪੀਡੀਆ ਦੇ 62 ਹਜ਼ਾਰ ਚਿਹਰੇ ਵੀ ਹਨ।
ਮਸ਼ਹੂਰ ਚਿਹਰੇ
Celeb Faces ਮਸ਼ਹੂਰ ਹਸਤੀਆਂ ਦੀਆਂ 200,000 ਵਿਆਖਿਆ ਵਾਲੀਆਂ ਤਸਵੀਰਾਂ ਵਾਲਾ ਇੱਕ ਵੱਡੇ ਪੈਮਾਨੇ ਦਾ ਡਾਟਾਬੇਸ ਹੈ। ਚਿੱਤਰ ਬੈਕਗ੍ਰਾਉਂਡ ਸ਼ੋਰ ਅਤੇ ਪੋਜ਼ ਭਿੰਨਤਾਵਾਂ ਦੇ ਨਾਲ ਆਉਂਦੇ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਟਾਸਕਾਂ ਵਿੱਚ ਸਿਖਲਾਈ ਟੈਸਟ ਸੈੱਟਾਂ ਲਈ ਕੀਮਤੀ ਬਣਾਉਂਦੇ ਹਨ। ਇਹ ਚਿਹਰੇ ਦੀ ਪਛਾਣ, ਸੰਪਾਦਨ, ਚਿਹਰੇ ਦੇ ਭਾਗ ਸਥਾਨੀਕਰਨ, ਅਤੇ ਹੋਰ ਬਹੁਤ ਕੁਝ ਵਿੱਚ ਉੱਚ ਸ਼ੁੱਧਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਬਹੁਤ ਫਾਇਦੇਮੰਦ ਹੈ।
YouTube-8M ਡੇਟਾਸੈੱਟ
YouTube-8M ਇੱਕ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਲੇਬਲ ਕੀਤਾ ਵੀਡੀਓ ਡੇਟਾਸੈਟ ਹੈ ਜਿਸ ਵਿੱਚ ਲੱਖਾਂ YouTube ਵੀਡੀਓ ਆਈਡੀ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਵਿਜ਼ੂਅਲ ਇਕਾਈਆਂ ਦੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਮਸ਼ੀਨ-ਤਿਆਰ ਐਨੋਟੇਸ਼ਨ ਹਨ। ਇਹ ਡੇਟਾਸੈਟ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਵੀਡੀਓ ਸਮਝ ਅਤੇ ਸਿਖਲਾਈ ਵਿਜ਼ਨ ਐਲਗੋਰਿਦਮ ਲਈ ਵਿਆਪਕ ਤੌਰ 'ਤੇ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਕਿਉਂਕਿ ਇਹ YouTube ਵੀਡੀਓ ਆਈਡੀ ਰਾਹੀਂ ਵੀਡੀਓ ਸਮੱਗਰੀ ਨੂੰ ਮੈਟਾਡੇਟਾ ਨਾਲ ਜੋੜਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਵੀਡੀਓ ਡੇਟਾ ਦਾ ਸਕੇਲੇਬਲ ਸੰਗ੍ਰਹਿ ਅਤੇ ਐਨੋਟੇਸ਼ਨ ਸੰਭਵ ਹੁੰਦਾ ਹੈ।
ਹੁਣ ਜਦੋਂ ਤੁਹਾਡੇ ਕੋਲ ਤੁਹਾਡੀ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਮਸ਼ੀਨਰੀ ਨੂੰ ਵਧਾਉਣ ਲਈ ਓਪਨ-ਸੋਰਸ ਇਮੇਜ ਡੇਟਾਸੇਟਾਂ ਦੀ ਇੱਕ ਵੱਡੀ ਸੂਚੀ ਹੈ। ਤੁਹਾਡੇ AI ਅਤੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਮਾਡਲਾਂ ਦਾ ਨਤੀਜਾ ਮੁੱਖ ਤੌਰ 'ਤੇ ਤੁਹਾਡੇ ਦੁਆਰਾ ਫੀਡ ਕੀਤੇ ਗਏ ਡੇਟਾਸੇਟਾਂ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਸਿਖਲਾਈ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਜੇਕਰ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਤੁਹਾਡਾ AI ਮਾਡਲ ਸਹੀ ਭਵਿੱਖਬਾਣੀਆਂ ਕਰੇ, ਤਾਂ ਇਸਨੂੰ ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾਸੇਟਾਂ ਦੀ ਲੋੜ ਹੈ ਜੋ ਸੰਪੂਰਨਤਾ ਲਈ ਇਕੱਠੇ ਕੀਤੇ ਗਏ ਹਨ, ਟੈਗ ਕੀਤੇ ਗਏ ਹਨ ਅਤੇ ਲੇਬਲ ਕੀਤੇ ਗਏ ਹਨ। ਇਹਨਾਂ ਡੇਟਾਸੇਟਾਂ ਨਾਲ ਕੰਮ ਕਰਨਾ ਵਿਹਾਰਕ, ਅਸਲ-ਸੰਸਾਰ ਪ੍ਰੋਜੈਕਟਾਂ ਰਾਹੀਂ ਤੁਹਾਡੇ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਹੁਨਰਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਵਧਾਉਣ ਦਾ ਇੱਕ ਵਧੀਆ ਤਰੀਕਾ ਹੈ। ਆਪਣੇ ਕੰਪਿਊਟਰ ਵਿਜ਼ਨ ਸਿਸਟਮ ਦੀ ਸਫਲਤਾ ਨੂੰ ਵਧਾਉਣ ਲਈ, ਤੁਹਾਨੂੰ ਆਪਣੇ ਪ੍ਰੋਜੈਕਟ ਵਿਜ਼ਨ ਨਾਲ ਸੰਬੰਧਿਤ ਗੁਣਵੱਤਾ ਵਾਲੇ ਇਮੇਜ ਡੇਟਾਬੇਸਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ।


