Articles of gawk

¿Cómo puedo replace el último partido con una cadena?

Dada una expresión regular y una cadena de reemploop, ¿cómo puedo usar awk para implementar lo siguiente? si una línea no contiene ninguna coincidencia, no hace nada; si una línea contiene más de una coincidencia, reemplace la última coincidencia con la cadena de reemploop, en el sentido de la última coincidencia que sería sustituida por […]

Usar AWK para combinar files

Tengo una carpeta con 179 files de text separados por tabuladores. Todos tienen el mismo formatting. Aquí hay un enlace a los datos de muestra: http://www.mvabl.com/public/sample_data.txt (Esta muestra tiene los 5 encabezados, las 5 líneas de datos que quiero y todos los datos finales que no quiero). Quiero quitar las cuatro primeras líneas del encabezado […]

¿Cómo hacer un pipe sort para gawk?

Tengo problemas para tratar de canalizar una especie de bobo. Actualmente tengo: gawk -f p3a01.awk unsortedNames.txt | sort | gawk -f p3a01.awk esto sin embargo me está dando los resultados incorrectos. El bobo parece funcionar bien si hago algo como: gawk -f p3a01.awk unsortedNames.txt | sort > test1.out gawk -f p3a01.awk test1.out No estoy seguro […]

separador de campo gawk como ascii extendido

Estoy usando gawk 3.1.7 en RHEL 6.x Tengo grandes files CSV para analizar con el separador de campo "Símbolo de negación lógica / ALT + 170" ( Ver tabla ASCII ), pero no pude usarlo como separador de campo en gawk . Intenté muchas cosas como -F "\xaa" , -F "\252" , pero no funcionó. […]

cómo usar \ n (y) \ n como delimitador en awk

Tengo un file que contiene datos a continuación 7[label = "ScanStep: T_b0\n(Ta = 1)\na\nb\nc\nd\ne\ndob\ntimestamp1\nUnc: Integer(8)\nUnc: Integer(8)\nUnc: Varchar(80)\nUnc: Numeric(10,2)\nUnc: Varbinary(80)\nUnc: Date(8)\nUnc: Timestamp(8)", color = "brown", shape = "box"]; 7[label = "ScanStep: cde_b1\nBuddies: (cde_b1, cde_b0, cde_b2)\n(public.cde.newcol = \'013\')\nssn\nnewcol\nmasked_ssn\nUnc: Numeric(10,2)\nUnc: Varbinary(80)\nUnc: Date(8)\nUnc: Timestamp(8)", color = "brown", shape = "box"]; hay múltiples inputs de este tipo. Necesito imprimir solo […]

awk salir del código si la expresión regular no coincide

Quiero get el código de salida 1 si la 4ª columna no coincide con la expresión regular, pero parece que awk devolverá 0, aunque la expresión regular no coincida. ¿Alguna idea de cómo hacer que awk devuelva 1 si la expresión regular no coincide? root@server:~# netstat -nap|grep "LISTEN\b" tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 1144/rsync […]

procesamiento de text (lectura e informática a partir de dos files)

Tengo un text como el siguiente: (palabras, dominios de palabras) car transport car machine bank economy bank politics bank parks God religion … Hay numerosas palabras, algunas palabras tienen dominios diferentes y otras tienen un solo dominio. Tengo otro file, una enorme matriz (300 dimensiones por línea) compuesta de palabras y un vector para cada […]

Cómo encontrar todas las coincidencias con una expresión regular en una cadena

En POSIX awk y Gawk respectivamente, ¿cómo podemos encontrar todas las coincidencias con una expresión regular en una cadena? Más específicamente, encuentre todas las coincidencias que están sustituidas por la function incorporada gsub , en términos de cualquiera de los siguientes dos objectives: encontrar la position y la longitud de cada coincidencia en la cadena […]

agregar y calcular porcentaje

Tengo dos columnas de datos, quiero agregar el número de loggings repetidos en la columna A y luego calcular el número de recuentos en la columna B y luego calcular el porcentaje de recuentos. Ejemplo: 494 1 494 494 494 1 500 500 1 500 501 501 501 1 501 Para 494, hay 4 loggings […]

herramientas de edición de flujo: salida de lo que se raspó

Me preguntaba si era posible utilizar diferentes herramientas de edición de flujo y procesamiento / manipulación de text; como grep, cut, sed, awk, perl, etc. ¿Hay forms de mostrar (en forma de file o STDOUT) el inverso de la salida (para decirlo de otra manera, lo que nunca se extrajo al ejecutar el command) de […]