User:Godfred Douglas/sandbox

Data ho nyansahu
Data nyansahu yɛ adesua a ɛfa nneɛma ahorow ho a ɛde akontaabu, nyansahu mu kɔmputa, nyansahu akwan, akwan horow, algorithms ne nhyehyɛe ahorow di dwuma de yi anaa wɔde yi nimdeɛ ne nhumu fi data a ɛyɛ dede, wɔahyehyɛ, ne nea wɔanhyehyɛ no mu.

Data nyansahu nso ka domain nimdeɛ a efiri application domain a ɛwɔ aseɛ no mu (e.g., abɔdeɛ ho nyansahu, nsɛm ho mfiridwuma, ne nnuruyɛ) bom. Data nyansahu wɔ afa horow pii na wobetumi aka ho asɛm sɛ nyansahu, nhwehwɛmu nhwɛso, nhwehwɛmu kwan, nteɛso, adwumayɛ kwan, ne adwuma.

Data nyansahu yɛ "adwene a wɔde bɛka akontaabu, data nhwehwɛmu, informatiks, ne akwan a ɛfa ho abom" de "ate nsɛm a ɛkɔ so ankasa ase na wɔayɛ mu nhwehwɛmu" ne data. Ɛde akwan ne nsusuwii ahorow a wonya fi nnwuma pii mu di dwuma wɔ akontaabu, akontaabu, kɔmputa ho nyansahu, nsɛm ho nyansahu, ne domain nimdeɛ mu. Nanso, ɛsono data ho nyansahu wɔ kɔmputa ho nyansahu ne nsɛm ho nyansahu ho. Turing Award nkonimdifo Jim Gray yɛɛ data nyansahu ho mfonini sɛ nyansahu mu "nhwɛso a ɛto so anan" (empirical, theoretical, computational, na mprempren data-driven) na ɔsii so dua sɛ "biribiara a ɛfa nyansahu ho resakra esiane nkɛntɛnso a nsɛm ho mfiridwuma anya" ne data nsuyiri no nti.

Data nyansahufo yɛ obi a ɔyɛ adwumaden a ɔyɛ koodu ho  nhyehyɛe a wɔyɛ na ɔde ka akontaabu ho nimdeɛ bom de yɛ nhumu fi data mu.

Mfapem
Data nyansahu yɛ adwuma a ɛfa nneɛma ahorow ho a wɔde wɔn adwene si nimdeɛ a wobeyi afi data ahorow a ɛtaa yɛ akɛse mu na wɔde nimdeɛ ne nhumu a efi saa data no mu adi dwuma de adi ɔhaw ahorow ho dwuma wɔ dwumadie domain ahodoɔ pii mu.Saa asɛmti yi fa data a wɔbɛsiesie ama nhwehwɛmu, data nyansahu mu haw ahorow a wɔbɛhyehyɛ, data mu nhwehwɛmu, ano aduru a wɔde data di dwuma a wɔbɛhyehyɛ, ne nea wɔahu a wɔde bɛma de akyerɛ gyinaesi ahorow a ɛkorɔn wɔ dwumadie domain ahodoɔ pii mu.Sɛnea ɛte no, ɛde nimdeɛ a efi kɔmputa nyansahu, akontaabu, nsɛm ho nyansahu, akontaabu, data mfoniniyɛ, nsɛm ho mfoniniyɛ, data sonification, data nkabom, mfoniniyɛ, nhyehyɛe a ɛyɛ den, nkitahodi ne adwumayɛ ka ho. Akontaabuo ho nimdefoɔ Nathan Yau, a ɔde Ben Fry di dwuma no nso de data nyansahu bata onipa ne kɔmputa nkitahodiɛ ho: ɛsɛ sɛ wɔn a wɔde di dwuma no tumi de nkateɛ di data so na wɔhwehwɛ mu. Wɔ afe 2015 mu no, Amerika Akontaabu Fekuw no kyerɛɛ database sohwɛ, akontabuo ne mfiri adesua, ne akyekyɛ nhyehyɛe ahorow a  ɛyɛ parallel  sɛ ɛyɛ adwumayɛfoɔ akuo mmiɛnsa a ɛreba.

Data nyansahu abusuabɔ a ɛda akontaabu ntam
Akontaabu ho abenfo pii a Nate Silver ka ho aka sɛ data ho nyansahu nyɛ adwuma foforo, na mmom ɛyɛ din foforo a wɔde frɛ akontaabu. Afoforo ka sɛ data ho nyansahu ne akontaabu nnyɛ pɛ efirisɛ data ho nyansahu ɛtwe adwene si ɔhaw ahorow ne akwan horow a ɛyɛ soronko wɔ dijitaal data ho so. Vasant Dhar kyerɛw sɛ akontaabu si data dodow ho nsɛm ne nkyerɛkyerɛmu so dua.Nea ɛne eyi bɔ abira no, data nyansahu di data dodow ne su ho dwuma (e.g., efi mfonini, nsɛm, atwerɛ, nkitahodi, adetɔfo ho nsɛm, ne nea ɛkeka ho) na esi nkɔmhyɛ ne adeyɛ so dua. Andrew Gelman a ɔwɔ Columbia Sukuupɔn mu aka akontaabu ho asɛm sɛ ɛyɛ ade a ɛho nhia wɔ data ho nyansahu mu.

Ɔbenfo David Donoho a ɔwɔ Stanford ka sɛ nhyehyɛe ahorow pii a wɔawie no di atoro hyɛ wɔn nkyerɛkyerɛ wɔ nhwehwɛmu ne akontaabu mu ho nkuran sɛ data-nyansahu nhyehyɛe bi mu ade titiriw, na datasets kɛse anaa akontaabu a wɔde di dwuma no nyɛ nneɛma a ɛtetew data nyansahu ne akontaabu ntam.Sɛnea ɔkyerɛ no, data nyansahu yɛ nteɛso a wɔde di dwuma a efii akontaabu a wɔde di dwuma wɔ amanne kwan so mu bae.

Data Nyansahu ne Data Nhwehwɛmu
Data nyansahu ne data nhwehwɛmu nyinaa yɛ nteɛso a ɛho hia wɔ data sohwɛ ne nhwehwɛmu mu, nanso ɛsono wɔ akwan titiriw pii so.Bere a nnwuma mmienu no nyinaa hwehwɛ sɛ wɔde data yɛ adwuma no, data nyansahu yɛ adwuma a ɛfa nneɛma ahorow ho kɛse a ɛfa akontaabu, kompuuta, ne mfiri adesua akwan a wɔde di dwuma de yi nhumu fi data mu na wɔyɛ nkɔmhyɛ ahorow ho, bere a data nhwehwɛmu twe adwene si nhwehwɛmu ne nkyerɛase so kɛse.

Data nhwehwɛmu taa hwehwɛ sɛ wɔde dataset nketewa a wɔahyehyɛ no bɛyɛ adwuma de abua nsɛmmisa pɔtee bi anaasɛ wobedi ɔhaw pɔtee bi ho dwuma.Eyi betumi ayɛ nnwuma te sɛ data ahotew, data ho mfoniniyɛ, ne data nhwehwɛmu de anya nhumu wɔ data no ho na wɔayɛ nsusuwii hunu a ɛfa twaka a ɛda nsakrae ahorow ntam ho.Akontaabu akwan na data nhwehwɛmufo taa de sɔ saa nsusuwii hunu yi hwɛ na wonya nsɛm firi data mu. Obi a ɔyɛ data mu nhwehwɛmu betumi ahwehwɛ adetɔn ho nsɛm mu de ahu sɛnea adetɔfo nneyɛe te na ɔde nyansahyɛ ahorow ama wɔ dawurubɔ akwan horow ho.

Nea ɛne eyi bɔ abira no, data nyansahu yɛ adeyɛ a ɛyɛ den na wɔsan yɛ no mpɛn pii a ɛhwehwɛ sɛ wodi dataset akɛse a ɛyɛ den a ɛtaa hia akontaabu ne kompuuta akwan a ɛyɛ nwonwa de yɛ nhwehwɛmu ho dwuma.Sɛ wɔde data a wɔanhyehyɛ, a nsɛm anaa mfonini ka ho reyɛ adwuma a, data ho nyansahufo taa de mfiri a wɔde sua ade di dwuma de yɛ nkɔmhyɛ nhwɛso ahorow na wɔpaw nneɛma a wɔde data di dwuma.Data nyansahu taa de dwumadi ahorow te sɛ feature engineering, data preprocessing, ne model selection ka akontaabu nhwehwɛmu ho. Data ho nyansahufo betumi de mfiri adesua nhyehyɛe ahorow adi dwuma de ahyɛ nea ɔde di dwuma no apɛde ho nkɔm na wahwehwɛ nea ɔde di dwuma no nneyɛe mu de ayɛ nhyehyɛe a wɔde bɛkamfo akyerɛ ama e-commerce platform so.

Data nyansahu trɛw kɔ akyiri sen data nhwehwɛmu denam nkɔmhyɛ nhwɛso ahorow a wɔbɔ ne nea wɔde di dwuma a wɔde ka bom na ama wɔatumi asi gyinae a ɛboro nhwehwɛmu no so, a ɛtwe adwene si nsɛm a wɔde ba awiei fi nsɛm a ɛwɔ hɔ mu so.Data ho nyansahufo taa hwɛ data a wɔboaboa ano na wosiesie, paw akwan a ɛyɛ sen biara a wɔfa so hwehwɛ nneɛma mu, na wɔde nhwɛso ahorow di dwuma wɔ tebea horow a mfaso wɔ so mu.Wodi nsɛm a ɛyɛ den ho dwuma na wohu nhwɛso ahorow a ahintaw wɔ dataset akɛse mu denam domain nimdeɛ, kɔmputa ho nyansahu, ne akontaabu a wɔde bom so.Wodi nsɛm a ɛyɛ den ho dwuma na wohu nhwɛso ahorow a ahintaw wɔ dataset akɛse mu denam domain nimdeɛ, kɔmputa ho nyansahu, ne akontaabu a wɔde bom so.

Data nyansahu ne data nhwehwɛmu yɛ mmeae a ɛwɔ abusuabɔ kɛse a ɛtaa hwehwɛ sɛ wonya ahokokwaw a ɛte saa ara, ɛmfa ho  nsonsonoe ahorow a ɛda wɔn tam.Nteɛso abien no nyinaa hwehwɛ sɛ wonya nhyehyɛe, akontaabu, ne data mfoniniyɛ mu nimdeɛ a emu yɛ den de ka tumi a wɔde bɛka nea wɔahu no ho asɛm yiye akyerɛ atiefo a wɔwɔ mfiridwuma ho nimdeɛ ne wɔn a wonni bi no.Bio nso, nteɛsoɔ mmienu no nyinaa nya mfasoɔ firi adwene a ɛyɛ katee ne domain ho nimdeɛ mu ɛfiri sɛ nhwehwɛmu ne nhwɛsoɔ a ɛfata gyina nteaseɛ a ɛfa nsɛm a ɛfa ho ne anifereɛ a ɛwɔ data no mu so.

Sɛ yɛbɛbɔ no mua a, wɔ asɛmti kɛseɛ a ɛfa data sohwɛ ne nhwehwɛmu mu no, data nyansahu ne data nhwehwɛmu yɛ nnwuma a ɛsono emu biara nanso ɛfa ho.Bere a data nyansahu fa ɔkwan a ɛkɔ akyiri a ɛka akontaabu nhwehwɛmu, kɔmputa akwan, ne mfiri adesua bom de yi nhumu, yɛ nkɔmhyɛ nhwɛso ahorow, na ɛkanyan gyinaesi a egyina data so no, data nhwehwɛmu twe adwene si nhumu a wobenya ne nsɛm a wɔde ba awiei afi data a wɔahyehyɛ mu.Nteɛso abien no nyinaa ho hia na ama wɔatumi de data tumi adi dwuma de ahu nneɛma a ɛrekɔ so, de aba awiei a nyansa wom, na wɔasiesie nsɛm a emu yɛ den wɔ nnwuma ahorow mu.

Hwɛ eyinom nso

 * Open Data Nyansahu Nhyiam
 * Nyansahumu Data
 * Mmea a wɔwɔ Data mu
 * Python (nhyehyɛe kasa)
 * R(nhyehyɛe kasa)
 * Data ho mfiridwuma
 * Data akɛse
 * Mfiri adesuadesua