ਡਾਟਾ ਐਨੋਟੇਸ਼ਨ - NER

ਕਲੀਨਿਕਲ NLP ਲਈ ਨਾਮਿਤ ਇਕਾਈ ਮਾਨਤਾ (NER) ਐਨੋਟੇਸ਼ਨ

ਨੇਰ ਐਨੋਟੇਸ਼ਨ

ਹੈਲਥਕੇਅਰ API ਦੇ ਅਗਲੇ ਸੰਸਕਰਣ ਨੂੰ ਬਣਾਉਣ ਲਈ ਕਲੀਨਿਕਲ NLP ਨੂੰ ਸਿਖਲਾਈ/ਵਿਕਸਤ ਕਰਨ ਲਈ ਚੰਗੀ ਤਰ੍ਹਾਂ-ਐਨੋਟੇਟਿਡ ਅਤੇ ਗੋਲਡ ਸਟੈਂਡਰਡ ਕਲੀਨਿਕਲ ਟੈਕਸਟ ਡੇਟਾ

ਕਲੀਨਿਕਲ ਨੈਚੁਰਲ ਲੈਂਗੂਏਜ ਪ੍ਰੋਸੈਸਿੰਗ (ਐਨਐਲਪੀ) ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਪਿਛਲੇ ਸਾਲਾਂ ਵਿੱਚ ਵੱਧ ਤੋਂ ਵੱਧ ਮਾਨਤਾ ਦਿੱਤੀ ਗਈ ਹੈ ਅਤੇ ਇਸ ਨਾਲ ਪਰਿਵਰਤਨਸ਼ੀਲ ਤਰੱਕੀ ਹੋਈ ਹੈ। ਕਲੀਨਿਕਲ NLP ਕੰਪਿਊਟਰਾਂ ਨੂੰ ਉਸ ਅਮੀਰ ਅਰਥ ਨੂੰ ਸਮਝਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਜੋ ਇੱਕ ਮਰੀਜ਼ ਦੇ ਡਾਕਟਰ ਦੁਆਰਾ ਲਿਖਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਪਿੱਛੇ ਪਿਆ ਹੁੰਦਾ ਹੈ। ਕਲੀਨਿਕਲ NLP ਵਿੱਚ ਜਨਸੰਖਿਆ ਸਿਹਤ ਵਿਸ਼ਲੇਸ਼ਣ ਤੋਂ ਲੈ ਕੇ ਕਲੀਨਿਕਲ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਸੁਧਾਰ ਤੋਂ ਲੈ ਕੇ ਬੋਲੀ ਦੀ ਪਛਾਣ ਤੋਂ ਲੈ ਕੇ ਕਲੀਨਿਕਲ ਅਜ਼ਮਾਇਸ਼ ਮੈਚਿੰਗ ਆਦਿ ਦੇ ਕਈ ਵਰਤੋਂ ਦੇ ਮਾਮਲੇ ਹੋ ਸਕਦੇ ਹਨ।

ਕਿਸੇ ਵੀ ਕਲੀਨਿਕਲ NLP ਮਾਡਲਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਸਿਖਲਾਈ ਦੇਣ ਲਈ, ਤੁਹਾਨੂੰ ਬਹੁਤ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਸਹੀ, ਨਿਰਪੱਖ, ਅਤੇ ਚੰਗੀ ਤਰ੍ਹਾਂ ਵਿਆਖਿਆ ਕੀਤੇ ਡੇਟਾਸੇਟਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਗੋਲਡ ਸਟੈਂਡਰਡ ਅਤੇ ਵਿਭਿੰਨ ਡੇਟਾ NLP ਇੰਜਣਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਅਤੇ ਯਾਦ ਨੂੰ ਵਧਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ।

ਵਾਲੀਅਮ

ਐਨੋਟੇਟ ਕੀਤੇ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਸੰਖਿਆ
10
ਐਨੋਟੇਟ ਕੀਤੇ ਪੰਨਿਆਂ ਦੀ ਸੰਖਿਆ
10 +
ਪ੍ਰੋਜੈਕਟ ਦੀ ਮਿਆਦ
< 1 ਮਹੀਨੇ

ਚੁਣੌਤੀ

ਕਲਾਇੰਟ ਆਪਣੇ ਨੈਚੁਰਲ ਲੈਂਗੂਏਜ ਪ੍ਰੋਸੈਸਿੰਗ (NLP) ਪਲੇਟਫਾਰਮ ਨੂੰ ਨਵੀਂ ਇਕਾਈ ਕਿਸਮਾਂ ਨਾਲ ਸਿਖਲਾਈ ਅਤੇ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਦੀ ਉਮੀਦ ਕਰ ਰਿਹਾ ਸੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਉਹ ਵਿਕਰੇਤਾਵਾਂ ਦਾ ਮੁਲਾਂਕਣ ਕਰ ਰਹੇ ਸਨ ਜਿਨ੍ਹਾਂ ਨੇ ਉੱਚ ਸ਼ੁੱਧਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕੀਤੀ, ਸਥਾਨਕ ਕਾਨੂੰਨਾਂ ਦੀ ਪਾਲਣਾ ਕੀਤੀ ਅਤੇ ਡੇਟਾ ਦੇ ਇੱਕ ਵੱਡੇ ਸਮੂਹ ਦੀ ਵਿਆਖਿਆ ਕਰਨ ਲਈ ਲੋੜੀਂਦਾ ਡਾਕਟਰੀ ਗਿਆਨ ਸੀ।

ਇਹ ਕੰਮ 20,000 ਤੱਕ ਲੇਬਲ ਕੀਤੇ ਰਿਕਾਰਡਾਂ ਨੂੰ ਲੇਬਲ ਅਤੇ ਐਨੋਟੇਟ ਕਰਨਾ ਸੀ ਜਿਸ ਵਿੱਚ ਇਨਪੇਸ਼ੈਂਟ ਅਤੇ ਆਊਟਪੇਸ਼ੇਂਟ ਇਲੈਕਟ੍ਰਾਨਿਕ ਹੈਲਥ ਰਿਕਾਰਡ (EHR) ਡੇਟਾ ਤੋਂ 15,000 ਤੱਕ ਲੇਬਲ ਕੀਤੇ ਰਿਕਾਰਡ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟਡ ਮੈਡੀਕਲ ਡਿਕਟੇਸ਼ਨਾਂ ਤੋਂ 5,000 ਤੱਕ ਲੇਬਲ ਕੀਤੇ ਰਿਕਾਰਡ, (1) ਅਤੇ ਜਿਓਗ੍ਰਾਫ (2) ਵਿੱਚ ਬਰਾਬਰ ਵੰਡੇ ਗਏ। XNUMX) ਉਪਲਬਧ ਡਾਕਟਰੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ।

ਇਸ ਲਈ, ਚੁਣੌਤੀਆਂ ਨੂੰ ਸੰਖੇਪ ਕਰਨ ਲਈ:

  • NLP ਪਲੇਟਫਾਰਮ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਿਭਿੰਨ ਕਲੀਨਿਕਲ ਡੇਟਾ ਨੂੰ ਸੰਗਠਿਤ ਕਰੋ
  • ਨਾਜ਼ੁਕ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵੱਖ-ਵੱਖ ਸੰਸਥਾਵਾਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਦੀ ਪਛਾਣ ਕਰੋ
  • ਗੁੰਝਲਦਾਰ ਕਲੀਨਿਕਲ ਦਸਤਾਵੇਜ਼ਾਂ ਦੇ ਇੱਕ ਵਿਸ਼ਾਲ ਸਮੂਹ ਨੂੰ ਲੇਬਲ / ਐਨੋਟੇਟ ਕਰਨ ਦੀ ਯੋਗਤਾ ਅਤੇ ਮਹਾਰਤ
  • ਨਿਰਧਾਰਤ ਸਮਾਂ ਸੀਮਾ ਦੇ ਅੰਦਰ ਕਲੀਨਿਕਲ NLP ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਡੇਟਾ ਦੀ ਇੱਕ ਵੱਡੀ ਮਾਤਰਾ ਨੂੰ ਲੇਬਲ / ਐਨੋਟੇਟ ਕਰਨ ਲਈ ਲਾਗਤ ਨੂੰ ਨਿਯੰਤਰਣ ਵਿੱਚ ਰੱਖਣਾ
  • ਕਲੀਨਿਕਲ ਡੇਟਾਸੈਟ ਵਿੱਚ ਇਕਾਈਆਂ ਨੂੰ ਐਨੋਟੇਟ ਕਰੋ ਜਿਸ ਵਿੱਚ 75% EHR ਅਤੇ 25% ਡਿਕਸ਼ਨ ਰਿਕਾਰਡ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ।
  • ਡਿਲੀਵਰੀ ਦੇ ਸਮੇਂ ਡਾਟਾ ਡੀ-ਪਛਾਣ

ਕੁਦਰਤੀ ਭਾਸ਼ਾ ਦੀ ਸਮਝ ਵਿੱਚ ਹੋਰ ਚੁਣੌਤੀਆਂ

ਅਜੀਬਤਾ

ਸ਼ਬਦ ਵਿਲੱਖਣ ਹੁੰਦੇ ਹਨ ਪਰ ਸੰਦਰਭ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹੋਏ ਵੱਖੋ-ਵੱਖਰੇ ਅਰਥ ਹੋ ਸਕਦੇ ਹਨ ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਸ਼ਬਦਾਵਲੀ, ਵਾਕ-ਰਚਨਾਤਮਕ ਅਤੇ ਅਰਥ-ਵਿਵਸਥਾ ਦੇ ਪੱਧਰਾਂ 'ਤੇ ਅਸਪਸ਼ਟਤਾ ਪੈਦਾ ਹੁੰਦੀ ਹੈ।

ਸਮਕਾਲੀ

ਅਸੀਂ ਇੱਕੋ ਵਿਚਾਰ ਨੂੰ ਵੱਖੋ-ਵੱਖਰੇ ਸ਼ਬਦਾਂ ਨਾਲ ਪ੍ਰਗਟ ਕਰ ਸਕਦੇ ਹਾਂ ਜੋ ਸਮਾਨਾਰਥੀ ਵੀ ਹਨ: ਕਿਸੇ ਵਸਤੂ ਦਾ ਵਰਣਨ ਕਰਦੇ ਸਮੇਂ ਵੱਡੇ ਅਤੇ ਵੱਡੇ ਅਰਥ ਇੱਕੋ ਜਿਹੇ ਹੁੰਦੇ ਹਨ।

ਸੰਦਰਭ

ਕਿਸੇ ਟੈਕਸਟ ਵਿੱਚ ਇੱਕੋ ਇਕਾਈ ਦਾ ਹਵਾਲਾ ਦੇਣ ਵਾਲੇ ਸਾਰੇ ਸਮੀਕਰਨਾਂ ਨੂੰ ਲੱਭਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਕੋਰਫਰੈਂਸ ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਕਿਹਾ ਜਾਂਦਾ ਹੈ।

ਸ਼ਖਸੀਅਤ, ਇਰਾਦਾ, ਜਜ਼ਬਾਤ

ਬੁਲਾਰੇ ਦੀ ਸ਼ਖਸੀਅਤ, ਉਹਨਾਂ ਦੇ ਇਰਾਦੇ ਅਤੇ ਜਜ਼ਬਾਤਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹੋਏ, ਇੱਕੋ ਵਿਚਾਰ ਲਈ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਪ੍ਰਗਟ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ।

ਦਾ ਹੱਲ

ਡਾਕਟਰੀ ਦਸਤਾਵੇਜ਼ਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਡਾਕਟਰੀ ਡੇਟਾ ਅਤੇ ਗਿਆਨ ਦੀ ਇੱਕ ਵੱਡੀ ਮਾਤਰਾ ਉਪਲਬਧ ਹੈ, ਪਰ ਇਹ ਮੁੱਖ ਤੌਰ 'ਤੇ ਇੱਕ ਗੈਰ-ਸੰਗਠਿਤ ਫਾਰਮੈਟ ਵਿੱਚ ਹੈ। ਮੈਡੀਕਲ ਇਕਾਈ ਐਨੋਟੇਸ਼ਨ / ਨੇਮਡ ਐਂਟਿਟੀ ਰੀਕੋਗਨੀਸ਼ਨ (ਐਨ.ਈ.ਆਰ.) ਐਨੋਟੇਸ਼ਨ ਦੇ ਨਾਲ, ਸ਼ੈਪ ਵੱਖ-ਵੱਖ ਕਿਸਮਾਂ ਦੇ ਕਲੀਨਿਕਲ ਰਿਕਾਰਡਾਂ ਤੋਂ ਲਾਭਦਾਇਕ ਜਾਣਕਾਰੀ ਦੀ ਵਿਆਖਿਆ ਕਰਕੇ ਗੈਰ-ਸੰਗਠਿਤ ਡੇਟਾ ਨੂੰ ਇੱਕ ਸਟ੍ਰਕਚਰਡ ਫਾਰਮੈਟ ਵਿੱਚ ਬਦਲਣ ਦੇ ਯੋਗ ਸੀ। ਇਕ ਵਾਰ ਇਕਾਈਆਂ ਦੀ ਪਛਾਣ ਹੋ ਜਾਣ ਤੋਂ ਬਾਅਦ, ਮਹੱਤਵਪੂਰਣ ਜਾਣਕਾਰੀ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਉਹਨਾਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਨੂੰ ਵੀ ਮੈਪ ਕੀਤਾ ਗਿਆ ਸੀ।

ਕੰਮ ਦਾ ਘੇਰਾ: ਹੈਲਥਕੇਅਰ ਇਕਾਈ ਦਾ ਜ਼ਿਕਰ ਐਨੋਟੇਸ਼ਨ

9 ਇਕਾਈ ਦੀਆਂ ਕਿਸਮਾਂ

  • ਮੈਡੀਕਲ ਹਾਲਤ
  • ਮੈਡੀਕਲ ਪ੍ਰਕਿਰਿਆ
  • ਸਰੀਰਿਕ ਬਣਤਰ
  • ਦਵਾਈ
  • ਮੈਡੀਕਲ ਉਪਕਰਣ
  • ਸਰੀਰ ਮਾਪ
  • ਪਦਾਰਥ ਨਾਲ ਬਦਸਲੂਕੀ
  • ਪ੍ਰਯੋਗਸ਼ਾਲਾ ਡਾਟਾ
  • ਸਰੀਰ ਦਾ ਕੰਮ

17 ਸੋਧਕ

  • ਦਵਾਈ ਸੋਧਕ: ਤਾਕਤ, ਯੂਨਿਟ, ਖੁਰਾਕ, ਤੋਂ, ਬਾਰੰਬਾਰਤਾ, ਰੂਟ, ਮਿਆਦ, ਸਥਿਤੀ
  • ਸਰੀਰ ਦੇ ਮਾਪ ਸੋਧਕ: ਮੁੱਲ, ਇਕਾਈ, ਨਤੀਜਾ
  • ਵਿਧੀ ਸੋਧਕ: ਵਿਧੀ
    • ਪ੍ਰਯੋਗਸ਼ਾਲਾ ਡੇਟਾ ਮੋਡੀਫਾਇਰ: ਲੈਬ ਵੈਲਯੂ, ਲੈਬ ਯੂਨਿਟ, ਲੈਬ ਨਤੀਜਾ
  • ਤੀਬਰਤਾ
  • ਪ੍ਰਕਿਰਿਆ ਦਾ ਨਤੀਜਾ

27 ਰਿਸ਼ਤੇ ਅਤੇ ਮਰੀਜ਼ ਦੀ ਸਥਿਤੀ

ਨਤੀਜਾ

ਐਨੋਟੇਟ ਕੀਤੇ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਲਾਇੰਟ ਦੇ ਕਲੀਨਿਕਲ NLP ਪਲੇਟਫਾਰਮ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਕੀਤੀ ਜਾਵੇਗੀ, ਜਿਸ ਨੂੰ ਉਹਨਾਂ ਦੇ ਹੈਲਥਕੇਅਰ API ਦੇ ਅਗਲੇ ਸੰਸਕਰਣ ਵਿੱਚ ਸ਼ਾਮਲ ਕੀਤਾ ਜਾਵੇਗਾ। ਗਾਹਕ ਨੂੰ ਪ੍ਰਾਪਤ ਹੋਏ ਫਾਇਦੇ ਸਨ:

  • ਲੇਬਲ ਕੀਤੇ/ਐਨੋਟੇਟ ਕੀਤੇ ਡੇਟਾ ਨੇ ਕਲਾਇੰਟ ਦੇ ਮਿਆਰੀ ਡੇਟਾ ਐਨੋਟੇਸ਼ਨ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਨੂੰ ਪੂਰਾ ਕੀਤਾ।
  • ਐਨਐਲਪੀ ਪਲੇਟਫਾਰਮ ਨੂੰ ਵਧੇਰੇ ਸ਼ੁੱਧਤਾ ਲਈ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਿਭਿੰਨ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਗਈ ਸੀ।
  • ਵੱਖ-ਵੱਖ ਇਕਾਈਆਂ ਵਿਚਕਾਰ ਸਬੰਧ, ਜਿਵੇਂ ਕਿ ਸਰੀਰਿਕ ਸਰੀਰ ਦੀ ਬਣਤਰ <> ਮੈਡੀਕਲ ਡਿਵਾਈਸ, ਮੈਡੀਕਲ ਸਥਿਤੀ <> ਮੈਡੀਕਲ ਡਿਵਾਈਸ, ਮੈਡੀਕਲ ਸਥਿਤੀ <> ਦਵਾਈ, ਮੈਡੀਕਲ ਸਥਿਤੀ <> ਪ੍ਰਕਿਰਿਆ ਦੀ ਗੰਭੀਰ ਡਾਕਟਰੀ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਪਛਾਣ ਕੀਤੀ ਗਈ ਸੀ।
  • ਲੇਬਲ/ਐਨੋਟੇਟ ਕੀਤੇ ਗਏ ਡੇਟਾ ਦੇ ਵਿਸ਼ਾਲ ਸਮੂਹ ਨੂੰ ਵੀ ਡਿਲੀਵਰੀ ਦੇ ਸਮੇਂ ਅਣ-ਪਛਾਣਿਆ ਗਿਆ ਸੀ।

Shaip ਦੇ ਨਾਲ ਸਾਡੇ ਸਹਿਯੋਗ ਨੇ ਹੈਲਥਕੇਅਰ ਦੇ ਅੰਦਰ ਅੰਬੀਨਟ ਟੈਕਨਾਲੋਜੀ ਅਤੇ ਕਨਵਰਸੇਸ਼ਨਲ AI ਵਿੱਚ ਸਾਡੇ ਪ੍ਰੋਜੈਕਟ ਨੂੰ ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ ਅੱਗੇ ਵਧਾਇਆ ਹੈ। ਸਿੰਥੈਟਿਕ ਹੈਲਥਕੇਅਰ ਸੰਵਾਦਾਂ ਨੂੰ ਬਣਾਉਣ ਅਤੇ ਟ੍ਰਾਂਸਕ੍ਰਿਬ ਕਰਨ ਵਿੱਚ ਉਹਨਾਂ ਦੀ ਮੁਹਾਰਤ ਨੇ ਰੈਗੂਲੇਟਰੀ ਚੁਣੌਤੀਆਂ ਨੂੰ ਦੂਰ ਕਰਨ ਵਿੱਚ ਸਿੰਥੈਟਿਕ ਡੇਟਾ ਦੀ ਸੰਭਾਵਨਾ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦੇ ਹੋਏ, ਇੱਕ ਠੋਸ ਬੁਨਿਆਦ ਪ੍ਰਦਾਨ ਕੀਤੀ। ਸ਼ੈਪ ਦੇ ਨਾਲ, ਅਸੀਂ ਇਹਨਾਂ ਰੁਕਾਵਟਾਂ ਨੂੰ ਨੇਵੀਗੇਟ ਕੀਤਾ ਹੈ ਅਤੇ ਹੁਣ ਅਸੀਂ ਅਨੁਭਵੀ ਸਿਹਤ ਸੰਭਾਲ ਹੱਲਾਂ ਦੇ ਸਾਡੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੂੰ ਸਾਕਾਰ ਕਰਨ ਦੇ ਇੱਕ ਕਦਮ ਦੇ ਨੇੜੇ ਹਾਂ।

ਗੋਲਡਨ-5-ਤਾਰਾ

ਆਪਣੀ ਗੱਲਬਾਤ AI ਨੂੰ ਤੇਜ਼ ਕਰੋ
100% ਦੁਆਰਾ ਐਪਲੀਕੇਸ਼ਨ ਵਿਕਾਸ