Data consejos perfil aplicación

R vs Python – ¿Cuál es mejor?

2020.04.01 16:59 artemination R vs Python – ¿Cuál es mejor?

En nuestro día a día es muy común que los estudiantes pregunten que lenguaje es más práctico para determinadas tareas. Con campos de trabajo cada vez más competitivos, muchos han optado por aprender ambos para así maximizar sus opciones laborales, pero si estas comenzando y aun no tienes claro como funciona cada uno, entonces te invitamos a que leas este articulo, que hemos traducido especialmente para aquellos que están incursionando por primera vez en el mundo del data análisis y el Big data.
En el perfil de Juan Gabriel Gomila vas a conseguir los mejores cursos en R, como Curso completo de Machine Learning: Data Science con RStudio, pero si estas mas interesado en aprender python, traemos para ti Curso completo de Machine Learning: Data Science en Python, en ambos podras aprender todos los elementos básicos e iras adentrándote en el mundo del Machine Learning. Ademas, con el curso de Machine Learning de la A a la Z: R y Python para data science, podras profundizar aun mas y obtener los mejores resultados, con una justa medida de teoría y practica para que te conviertas en un experto. y continúes avanzando en tu camino al éxito.
R vs Python – ¿Cuál es mejor?
Si está leyendo este artículo, me imagino que tú, como muchos otros científicos de datos, se está preguntando qué lenguaje de programación deberías aprender. Tanto si tienes experiencia en otras herramientas de codificación como si no, las características individuales de estas dos, incluyendo los vastos conjuntos de bibliotecas y paquetes pueden parecer inicialmente desalentadoras, pero no te preocupes, ¡estamos aquí para ayudarte!
Para sorpresa de nadie, tanto R como Python presentan sus respectivas ventajas para una gran cantidad de aplicaciones y son ampliamente utilizadas por los profesionales en su comunidad global. Este artículo le ayudará a decidir cuál de las dos tiene las herramientas adecuadas para ponerse en marcha.
Para empezar, probablemente es una buena idea revisar en qué exactamente quieres usar el lenguaje de programación en términos de tu ciencia de los datos. Por ejemplo, un científico de datos que trabaje predominantemente en la investigación genética puede encontrarse entre los que utilizan R (ya que es muy utilizado en la genética y popular entre los bioinformáticos), mientras que alguien que trabaje en modelos para el análisis de imágenes, por ejemplo, un empleado de Tesla que crea tecnología de auto-conducción de coches, podría encontrarse trabajando con personas que prefieren Python, debido a sus sofisticadas herramientas de manipulación de imágenes. En última instancia, sigue siendo su elección, y aunque normalmente una buena filosofía nunca sería hacer a ciegas aquello que los demás están haciendo, es necesario tomarse el tiempo de descubrir por qué estos profesionales prefieren ciertos idiomas. Es importante ser capaz de «hablar» el mismo idioma que tus futuros compañeros.
Si aún no lo has hecho, te aconsejo que eches un vistazo a las entradas en el blog de SuperDataScience relacionadas con R y Python en el lugar de trabajo, y Aprende todos los pros y contras de la programación de Python vs R para conocer las diferencias claves entre los dos, y sus usos en el campo.
¿Quién usa R y cuál es su objetivo?
R fue creado inicialmente como una plataforma para la computación estadística, albergando todas las pruebas clásicas, análisis de series de tiempo, agrupación, y más. Tiene una gran comunidad de mineros de datos, lo que significa una gran cantidad de paquetes accesibles, tanto para los desarrolladores de R como para los usuarios. En cuanto a los gráficos, hay multitud de paquetes y capas para trazar y analizar gráficos, como ggplot2. Es importante destacar que R ha surgido en el nuevo estilo de escena de la inteligencia artificial proporcionando herramientas para las redes neuronales, el machine learning y la inferencia bayesiana y es compatible con paquetes para Deep Learning como MXNet y TensorFlow. Parecería que R tiene un sólido seguimiento no sólo de los científicos de datos, sino también en gran medida de los estadísticos y campos asociados que requieren manipulación de datos (por ejemplo, los de la medicina, las finanzas y las ciencias sociales). Para nosotros, los científicos de datos, es importante encontrar un programa ampliamente utilizado; queremos ser capaces de hablar con tantas disciplinas como sea posible dentro de un idioma, haciendo que nuestros hallazgos sean fácilmente traducibles.
¿Quién usa Python y cuál es su objetivo?
Al otro lado de la cancha, Python es una excelente herramienta para programadores y desarrolladores en general. Ya sea desarrollando algoritmos para simular biomoléculas o entregando software anti-spam, te encontrarás en casa usando su interfaz y su conjunto de funciones. Lanzado en 1989, es citado como uno de los lenguajes de programación orientados a objetivos de uso general más importantes. Python tiene una creciente popularidad entre los nuevos programadores (entre ellos los científicos de datos), lo que por supuesto significa una rica comunidad de usuarios y solucionadores de problemas.
Del mismo modo, en el tema candente de la inteligencia artificial, Python es también la opción más popular; tiene herramientas para el Machine Learning, redes neuronales y Tensorflow. Además, abarcando algunos objetivos más generales, sus usuarios se benefician de bibliotecas como NumPy para el análisis estadístico, pandas para la preparación de datos, y seaborn para la generación de gráficos.
R contra Python: Limitaciones
A la parte más interesante: ¿cómo se relacionan cada uno de ellos? Descubrir las limitaciones a tiempo es posiblemente uno de los consejos más importantes. Hablando desde la experiencia, pasando de usar Matlab donde hay una enormidad de apoyo en línea (y generalmente alguna persona maravillosa que ha escrito un código exacto para tus necesidades), a labVIEW donde había poca o ninguna presencia en línea, conozco muy bien la sensación de pánico y de ser incapaz de resolver ese error y de frustrarse por no haber considerado estas posibles limitaciones.
Algunas de las principales consideraciones para una aplicación de la ciencia de los datos son:
La velocidad de procesamiento (¿utilizará grandes cantidades de datos?)
Comunidad en línea (realmente es invaluable y me ha salvado muchas veces)
Una curva de aprendizaje empinada (¿cuánto tiempo y paciencia tienes para especializarte/ya has aprendido programación antes y estás mejor equipado para aprender un nuevo idioma?)
Interfaz fácil de usar (¿estás familiarizado con la programación o prefieres algo fácil de visualizar y bonito?)
Ampliamente hablado (¿Ha considerado futuras conexiones entre los campos y sus lenguajes?)
Veamos cómo le va a cada uno en estos temas…
Velocidad de procesamiento:
R se considera lento. Requiere que sus objetos se almacenen en una memoria física, lo que significa que no es una gran opción cuando se trata de aprovechar los grandes datos. Dicho esto, los procesadores más rápidos están reduciendo esta limitación, y hay varios paquetes por ahí enfocados a abordar esto. Python, sin embargo, es más adecuado para grandes conjuntos de datos y su capacidad para cargar grandes archivos más rápido.
Comunidad en línea:
Como mencioné, tanto R como Python tienen una red de soporte ampliamente respaldada a la que puedes llegar, siendo esta una fuente de ayuda invaluable para esos bugs que parece que no puedes solucionar fácilmente.
Una curva de aprendizaje empinada:
Esto puede o no considerarse como una limitación de R, pero su empinada curva de aprendizaje se debe a su gran poder para los estadísticos. Siendo desarrollado por expertos en el campo, R es una herramienta increíble, pero se paga el precio de esto con su inversión inicial de tiempo. Por otro lado, Python es muy atractivo para los nuevos programadores por su facilidad de uso y su relativa accesibilidad.
Ambos programas requerirán que te familiarices con la terminología, lo cual puede parecer inicialmente desalentador y confuso (como la diferencia entre un «paquete» y una «biblioteca»), con la configuración de Python teniendo la ventaja sobre R en términos de la experiencia de uso fácil, de nuevo un vínculo con R que está siendo desarrollado por los estadísticos y basado en gran medida en su maduro predecesor, S. Aunque, Python será implacablemente estricto con los usuarios en cuanto a la sintaxis y se negará a funcionar si no se han encontrado fallos fáciles de detectar (aunque éstos mejoran la experiencia del usuario a largo plazo ya que nos hace mejores y más pulcros escritores de código). R tiene el encantador atributo, en relación con sus numerosos usuarios académicos, de proporcionar al usuario mucho más control sobre el diseño de sus gráficos, permitiendo diversas exportaciones de pantallas y formatos.
Es importante señalar que ambos se basan en el intérprete y se ha descubierto, en relación con otros lenguajes (como C++), que esto facilita mucho la detección de errores.
Interfaz de fácil manejo:
Rstudio es ampliamente considerada la plataforma favorita para la interfaz en R y una vez que empieces a familiarizarte con ella, entenderás por qué es así. Está clasificado como un entorno de desarrollo integrado (IDE) y comprende una consola para la ejecución directa de código con todas las funciones para trazar, soportar gráficos interactivos, depuración y gestión del espacio de trabajo, ver Características del IDE de RStudio para una guía más detallada.
Python alberga numerosas IDEs para la elección. El beneficio de esto es que proporciona una buena oportunidad para que usted elija uno que le resulte familiar en base a sus antecedentes. Por ejemplo, viniendo de una formación en informática, Spyder es un claro favorito. Mientras que los principiantes en el campo encuentran PyCharm accesible e intuitivo.
Ampliamente utilizado:
Hemos tocado este tema y me gustaría subrayar que esto es subjetivo al campo elegido. Si te inclinas por los campos de la academia, las finanzas, la salud, la R sería probablemente mucho más hablado y querrás aprovecharlo. Mientras que, aquellos que estén interesados en el desarrollo de software, automatización o robótica, pueden encontrarse inmersos en la comunidad Python.
R vs Python: Ventajas
R:
Una excelente elección si quieres manipular los datos. Cuenta con más de 10.000 paquetes de datos que se encuentran en su CRAN.
Puede crear hermosos gráficos de calidad de publicación muy fácilmente; R permite a los usuarios alterar la estética de los gráficos y personalizarlos con una mínima codificación, una gran ventaja sobre sus competidores.
Tal vez su herramienta más poderosa es su modelado estadístico, creando herramientas estadísticas para los científicos de datos y siendo los precursores en este campo, preferidos por los programadores experimentados.
Los usuarios se benefician de su interfaz con la gran plataforma de Github para descubrir y compartir un mejor software.
Python:
Es muy fácil e intuitivo de aprender para los principiantes (a diferencia de R, Python fue desarrollado por programadores, y su facilidad de uso lo convierte en el favorito de las universidades en general).
Es atractivo para una amplia gama de usuarios, creando una comunidad cada vez mayor en más disciplinas y una mayor comunicación entre los lenguajes de código abierto.
La sintaxis estricta te obligará a convertirte en un mejor codificador, escribiendo un código más condensado y legible.
Python es más rápido en el manejo de grandes conjuntos de datos y puede cargar los archivos con facilidad, haciéndolo más apropiado para aquellos que manejan grandes datos.
Con todo esto en mente, la elección de un idioma para empezar depende en gran medida de lo que se quiere de él. Si eres el tipo de científico de datos que se especializa en análisis estadístico o trabajas en investigación, puedes encontrar que la R funciona mejor para ti. Sin embargo, si eres alguien que se ve a sí mismo ramificando a través de múltiples disciplinas, podrías hacer uso de la generalidad de Python y su diversa red. También puedes estar de acuerdo en que te beneficiaría eventualmente aprender ambas (al menos lo suficiente como para poder leer la sintaxis del otro) a medida que conozcas a cada uno por sus respectivas fortalezas. Esto sin duda te abrirá más puertas en términos de oportunidades de empleos y, lo que es más importante, te dará esa claridad para decidir qué camino profesional quieres tomar. Pero no te agobies; ¡aprender el segundo idioma será más fácil que el primero! Sin duda, también te entusiasmará abrir una nueva comunidad para sumergirte en tu crecimiento como científico de datos.
submitted by artemination to bigdata [link] [comments]


2019.01.04 03:04 l4y3r8 [DATA] Trabajo de QA (Quality Assurance) Manual y Automation

El comentario que publiqué en un post sobre búsqueda laboral generó muchas consultas. Por lo visto a varios les interesó, asi que hago este post para resumir toda la información que publiqué y también respondí en preguntas que me mandaron por mensaje.
Si entraste a este post y no sabes de que corno estoy hablando, pegale una leida. En resumen: estoy dando una guia para conseguir un laburito piola, comodo y bien pago. Hay que ponerse a estudiar en casa, pero no es tanto y vale la pena (equivalente a rendir 1 o 2 finales para la facultad). Lo que si, es excluyente en el 90% de los casos, saber Inglés. Mas abajo lo detallo mejor.
Escribí esto de una sola pasada, asi que a medida que me vaya acordando de cosas, voy a ir updateando el post principal y agregando la data que vaya respondiendo de las consultas que surjan.
Todo lo que explico en este post, no aplica por igual a todas las empresas de informática. Hay algunas que exigen mucho mayor nivel de conocimiento tecnico (como el caso de Despegar . com que solo contrata gente estudiando carreras relacionadas o recibidos). Y hay muchas otras, que con tener estos conocimientos bien sabidos, podes formar parte de un proyecto sin problemas.
Si alguien del rubro está leyendo esto y encontró algun error o tiene algo para aportar, dejenló en un comentario asi lo sumo.
UPDATE Agregados los aportes de los comentarios hasta el viernes 4/1/2019 7:50pm CTRL+F "aporte de" para buscar los updates 






submitted by l4y3r8 to argentina [link] [comments]