Articles of grep

Extrae la URL del patrón específico (Google Alert)

He intentado todas las combinaciones posibles (para mi conocimiento) de los commands grep y sed, pero no puedo extraer las URL con el siguiente patrón (correos electrónicos de Google Alert en text plano): "url": "https://www.google.com/url?rct=3Dj\u0026sa=3Dt\u0026url=3Dhtt= p://abcnews.go.com/US/wireStory/judge-orders-forfeiture-cartel-money-launde= ring-case-44765120\u0026ct=3Dga\u0026cd=3DCAEYACoTNzAxNDE5ODc4MzMzMTc5OTA4O= TIaYjdkMGIxMjNmMjc0YWM4ODpjb206ZW46VVM\u0026usg=3DAFQjCNHKeTb3brU2sr0qOpXXJ= fuW9Nfntg" Obviamente, lo que quiero extraer es: http://abcnews.go.com/US/wireStory/judge-orders-forfeiture-cartel-money-laundering-case-44765120 Entonces necesito extraer lo que está entre "url = […]

Obtención de líneas únicas con cadenas coincidentes

Tengo un file de loggings de text similar a JSON con identificadores duplicates que se parecen a: {"ID":"93" , "ST":[42,77,51]} {"ID":"21" , "ST":[43,4]} {"ID":"94" , "ST":[65,11,4]} {"ID":"93" , "ST":[42,77,51,29,63]} {"ID":"73" , "ST":[21,20]} {"ID":"94" , "ST":[65,11,4]} {"ID":"77" , "ST":[87]} Intento filtrar los duplicates y siempre mantener la primera aparición de tal coincidencia. El campo ST podría […]

Cómo filtrar el post de éxito al usar la exploración del puerto nc

Utilicé el siguiente command para escanear puertos de mi máquina nc -zv 192.168.1.1 1-100 pero quiero filtrar solo el post correcto de la salida siguiente. He usado el siguiente command nc -zv 192.168.1.1 1-100|grep succeeded Pero no sirve, todavía muestra la salida completa nc: connect to 192.168.1.1 port 1 (tcp) failed: Connection refused nc: connect […]

Analizar datos multidimensionales en párrafos

Estoy tratando de analizar datos de un informe PDF y filtrar ciertos elementos interesantes. Usando pdftotext -layout obtengo datos en este formatting como mi punto de partida: Record Info Interesting 123 apple yep orange nope lemon yep ———————————————– 456 dragonfruit yep cucumber nope ———————————————– 789 kumquat nope lychee yep passionfruit yep yam nope ———————————————– 987 […]

Busque en un file las líneas que NO contienen una frase con context

Tengo un file con muchas inputs que consisten en una palabra key seguida de varias líneas de numbers. Quiero filtrar una categoría de inputs, así que si derp de input es seguido por tres líneas, quiero algo como grep -v -A3 derp filename para get cada input en nombre de file que NO sea de […]

Web front-end para encontrar / grep / ack

En mi laboratorio, estamos tratando de crear una web que permita al usuario ingresar consultas para find , ack , grep en un directory específico. La web devolvería un HTML con una tabla de una list de files en los que se puede hacer clic (hacer clic en ellos downloadía el file). Por ejemplo, en […]

Linux fgrep cómo extraer "only_words_in_my_language" de un gran file "MIXED_WORDS"?

Quiero que se extraiga "only_words_in_my_language (900kb)" de un gran file "MIXED_WORDS (160mb)" y para eso utilicé la syntax siguiente pero con resultados pobres: fgrep -w -f "only_words_in_my_language.txt" "MIXED_WORDS_from_all_over_the_world" > extracted_word_of_my_country_only.txt Es por eso que estoy pensando mmmm .. '' COINCIDIR '' TODA LA PALABRA, para get mejores resultados Por ejemplo, esta es una PALABRA en […]

pgrep para processs que no están asociados con un terminal en ubuntu

Me gustaría encontrar todos los PID de processs que no están asociados con un terminal. Cuando hago el ps aux | less command, veo en el campo TTY una gran cantidad de processs con? personaje Me gustaría get esa identificación de processs, ¿hay alguna manera de hacerlo con pgrep? Traté de ver el documental aquí […]

¿Cómo ordero la salida de grep por hora + date de creación del file?

Cuando ejecuto este command, grep _rlnAveragePmax *model* Obtengo esta salida: run_ct6_it006_model.star:_rlnAveragePmax 0.153500 run_ct6_it007_model.star:_rlnAveragePmax 0.096772 run_it000_model.star:_rlnAveragePmax 0.000000 run_it001_model.star:_rlnAveragePmax 0.008995 run_it002_model.star:_rlnAveragePmax 2.517429e-04 run_it003_model.star:_rlnAveragePmax 0.003727 run_it004_model.star:_rlnAveragePmax 0.056681 run_it005_model.star:_rlnAveragePmax 0.109754 run_it006_model.star:_rlnAveragePmax 0.153500 Pero el resultado anterior está orderado alfabéticamente. Si los orderamos por date / hora creada, la salida debería verse así: run_it000_model.star:_rlnAveragePmax 0.000000 run_it001_model.star:_rlnAveragePmax 0.008995 run_it002_model.star:_rlnAveragePmax 2.517429e-04 run_it003_model.star:_rlnAveragePmax […]

Coincidencia de todos los patrones del file a la vez

Tengo 2 files: args y text . Por ejemplo: args: [contiene arguments de un script] life happy horse text: The horse has a happy life. Life is fun. Kids are happy. Necesito un command que imprima las líneas del text que contiene todos los patrones de args . En este caso: The horse has a […]